Big Data

Seiring dengan semakin bertumbuhnya penggunaan internet, semua orang dapat terhubung dan saling memberikan data tanpa terpisah jarak dan waktu. Berbagai jenis data, mulai data yang berupa teks, gambar, audio, video dan animasi baik yang terstruktur maupun tidak terstruktur. Pertumbuhan data ternyata sangat mempengaruhi perkembangan volume dan jenis data yang terus meningkat secara signifikan dan bisa dikatakan telah melampaui batas media penyimpanan maupun sistem database yang ada saat ini.

Tentu diperlukan jalan keluar dalam mengatasi hal tersebut, Big Data adalah solusi yang ditawarkan belakangan ini karena dapat diasumsikan sebagai media penyimpanan data yang menawarkan ruang tak terbatas, serta kemampuan untuk mengakomodasi dan memperoses berbagai jenis data dengan sangat cepat.

Volume Velocity Variety

Volume Jumlah data yang sangat besar dari berbagai sumber, kondisi saat ini mulai puluhan Terabyte hingga puluhan petabyte
Velocity Frekuensi munculnya data dan perubahan data sangat cepat dalam hitungan detik
Variety Jenis data yang sangat beragam mempunyai format yang berbeda-beda baik terstruktur maupun tidak terstruktur

 

Pentingnya Big Data, tidak hanya berdasarkan pada jumlah data yang dimiliki, tetapi hal yang penting adalah bagaimana mengolah data internal dan eksternal. Kita dapat mengambil data dari sumber manapun dan menganalisanya untuk menemukan jawaban yang diinginkan oleh instansi/perusahaan kita. Selain itu tujuan digunakan Big Data, yaitu:

  1. Penghematan Biaya
  2. Pengambilan keputusan yang cepat
  3. Pengambilan Keputusan yang cerdas
  4. Pengembangan/Inovasi produk

 

Big Data & Traditional Analytics

Big Data Traditional Analytics
Type of data Unstructured formats Formatted in rows andĀ  columns
Volume of data 100 terabytes to petabytes Tens of terabytes of less
Flow of data Constant flow of data Static pool of data
Analysis Machine Learning Hypothesis based
Primary purpose Data-based products Internal decision supportĀ  and services

 

Salah satu contoh teknologi Big Data yang digunakan adalah Apache Hadoop

Rating