Kapan kita bisa memprediksi dengan sempurna? Tanggal 32 |
Movig MNIST? Sebelum itu, MNIST itu apa? MNIST atau kepanjaingannya Modified National Institute of Standard Technology adalah dataset standar untuk bidang computer vision. Isi dataset ini adalah sekumpulan tulisan tangan angka 0 sampai 9. Jadinya, moving MNIST berarti adalah dataset tulisan tangan tesebut yang bergerak. Bergerak artinya gambar ini tidak tunggal melainkan serangkaian gambar sehingga jika dilihat 1 per 1 secara cepat, tulisan tangan pada gambar akan terlihat bergerak a.k.a video.
Di postingan terdahulu kita pernah melakukan klasifikasi MNIST ini menggunakan ANN. Walaupun sebenarnya ini adalah video tapi tiap frame dalam video tersebut sudah disimpan dalam bentuk array numpy. Sehingga tujuan dari postingan ini adalah untuk melakukan unboxing data moving MNIST tersebut.
Unboxing di sini dimaksudkan mengextract gambar graymap dari data array object numpy menjadi representasi gambar untuk data moving MNIST tersebut.
Object numpy array tersebut adalah matriks 4 dimensi dengan ukuran (10000, 20, 64, 64). Ini dimaksudkan ada 10000 cuplikan MNIST yang bergerak sebanyak 20 frame dengan dimensi gambarnya 64 x 64.
Motivasi kita melakukan unboxing ini adalah kita ingin melihat wujud asli dari data moving MNIST ini. Wujud asli dalam bentuk apa? Tentu saja gambar.
Sebelum unboxing kita tentu harus punya datanya dulu. Datanya bisa di download di sini.
Tampilan website tempat download data moving MNIST. |
Setelah di download, masukkan file tersebut ke direktori yang sama dengan script yang akan di buat untuk unboxing nanti (gampangnya ke direktori home anda masing-masing jadi tinggal buat scriptnya di direktori home).
Jalankan script itu dan kita dapatkan wujud asli dari data object array numpy ini seperti gambar di bawah.
Dalam script ini, yang melakukan unboxing tersebut adalah 4 baris terakhir. Sisanya adalah read data dan beberapa hal yang kurang penting untuk unboxing.
Script tersebut tujuannya bukan murni untuk unboxing data MNIST ini, Script ini adalah potongan script untuk nantinya yang punya tujuan lebih besar. Mau tahu untuk apa? Stay tune :)) .
referensi:
https://www.kaggle.com/c/digit-recognizer, di akses tanggal 20 November 2017
mau tanya, sebenarnya interpretasi dari gambar mnist sendiri itu bagaimana ya?
BalasHapusGambar mnist adalah kumpulan tulisan tangan untuk angka 0 sampai 9. Gambar mnist yang dalam 1 frame pada kasus ini bisa dianggap suatu video jika melihatnya secara cepat dan bergantian
Hapus