Seiring dengan semakin bertumbuhnya penggunaan internet, semua orang dapat terhubung dan saling memberikan data tanpa terpisah jarak dan waktu. Berbagai jenis data, mulai data yang berupa teks, gambar, audio, video dan animasi baik yang terstruktur maupun tidak terstruktur. Pertumbuhan data ternyata sangat mempengaruhi perkembangan volume dan jenis data yang terus meningkat secara signifikan dan bisa dikatakan telah melampaui batas media penyimpanan maupun sistem database yang ada saat ini.
Tentu diperlukan jalan keluar dalam mengatasi hal tersebut, Big Data adalah solusi yang ditawarkan belakangan ini karena dapat diasumsikan sebagai media penyimpanan data yang menawarkan ruang tak terbatas, serta kemampuan untuk mengakomodasi dan memperoses berbagai jenis data dengan sangat cepat.
Volume | Jumlah data yang sangat besar dari berbagai sumber, kondisi saat ini mulai puluhan Terabyte hingga puluhan petabyte |
Velocity | Frekuensi munculnya data dan perubahan data sangat cepat dalam hitungan detik |
Variety | Jenis data yang sangat beragam mempunyai format yang berbeda-beda baik terstruktur maupun tidak terstruktur |
Pentingnya Big Data, tidak hanya berdasarkan pada jumlah data yang dimiliki, tetapi hal yang penting adalah bagaimana mengolah data internal dan eksternal. Kita dapat mengambil data dari sumber manapun dan menganalisanya untuk menemukan jawaban yang diinginkan oleh instansi/perusahaan kita. Selain itu tujuan digunakan Big Data, yaitu:
- Penghematan Biaya
- Pengambilan keputusan yang cepat
- Pengambilan Keputusan yang cerdas
- Pengembangan/Inovasi produk
Big Data & Traditional Analytics
Big Data | Traditional Analytics | |
Type of data | Unstructured formats | Formatted in rows andĀ columns |
Volume of data | 100 terabytes to petabytes | Tens of terabytes of less |
Flow of data | Constant flow of data | Static pool of data |
Analysis | Machine Learning | Hypothesis based |
Primary purpose | Data-based products | Internal decision supportĀ and services |
Salah satu contoh teknologi Big Data yang digunakan adalah Apache Hadoop