Pengertian
Big Data (WHAT)
Big data adalah volume tinggi ,
kecepatan tinggi , dan / atau berbagai tinggi aset informasi yang memerlukan
bentuk-bentuk baru pengolahan untuk memungkinkan pengambilan keputusan
ditingkatkan , wawasan penemuan dan optimasi proses. "Big Data didefinisikan sebagai sebuah problem domain di mana
teknologi tradisional seperti relational database tidak mampu lagi untuk
melayani. Definisi Big di sini adalah volume, velositas dan variasi
datanya.
Menurut
(Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku
untuk informasi yang tidak dapat diproses atau dianalisis menggunakan alat
tradisional.
Menurut
(Dumbill, 2012) , Big Data adalah data
yang melebihi proses kapasitas dari kovensi sistem database yang ada. Data
terlalu besar dan terlalu cepat atau tidak sesuai dengan struktur arsitektur
database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih jalan
altenatif untuk memprosesnya.
(Cannolly,
2012)
Pengunaan Big Data (WHO dan WHERE)
Big data digunakan oleh semua kalangan dari instansi
pemerintahan sampai lembaga masyatakat dan digunakan juga oleh lembaga swasta
yang sekarang sudah menjadi sukses dengan menggunakan Big data berikut ini
contoh penggunaan Big data:
1Contoh Pemerintah.
Pada tahun 2012 , pemerintahan
Obama mengumumkan Big Data Penelitian dan Pengembangan Inisiatif , yang
mengeksplorasi bagaimana data besar bisa digunakan untuk mengatasi
masalah-masalah penting yang dihadapi oleh pemerintah . Inisiatif ini terdiri
dari 84 program big data yang berbeda yang tersebar di enam departemen .
Analisis data besar memainkan
peran besar dalam kampanye Barack Obama sukses 2012 pemilihan ulang . Amerika Serikat Pemerintah Federal memiliki
enam dari sepuluh superkomputer paling kuat di dunia. Utah Data Center adalah
pusat data saat ini sedang dibangun oleh Amerika Serikat National Security
Agency . Ketika selesai , fasilitas tersebut akan mampu menangani Yottabytes
informasi yang dikumpulkan oleh NSA melalui Internet.
2. Contoh di Sektor
Swasta
eBay.com menggunakan dua gudang
data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk pencarian,
rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data warehouse.
Amazon.com menangani jutaan
operasi back-end setiap hari, serta pertanyaan dari lebih dari setengah juta
penjual pihak ketiga . Teknologi inti yang membuat Amazon berjalan adalah
berbasis Linux dan pada 2005 mereka memiliki tiga database Linux terbesar di
dunia , dengan kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB. Walmart menangani
lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke database
diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - .
Setara dengan 167 kali informasi yang terdapat dalam semua buku di Perpustakaan
Kongres AS.
FICO Falcon Penipuan Kartu Kredit
Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
Volume data bisnis di seluruh
dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut
perkiraan.
Windermere Real Estate
menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk membantu
pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari tempat
kerja di berbagai kali dalam sehari .
3. Contoh di Bidang Arsitektur
Pada tahun 2004 , Google menerbitkan sebuah makalah
tentang proses yang disebut MapReduce yang menggunakan arsitektur tersebut .
MapReduce framework menyediakan model pemrosesan paralel dan implementasi
terkait untuk memproses sejumlah besar data . Dengan MapReduce , query dibagi
dan didistribusikan di seluruh node paralel dan diproses secara . Hasilnya
kemudian dikumpulkan dan disampaikan. Kerangka itu sangat sukses sehingga orang
lain ingin meniru algoritma . Oleh karena itu , sebuah implementasi dari
kerangka MapReduce diadopsi oleh sebuah proyek open source Apache Hadoop
bernama Teknologi Topological
Program Analisis Data DARPA.
4. Contoh di Bidang Pasar
" Big Data
" telah meningkatkan permintaan spesialis manajemen informasi dalam
Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell
telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak
hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 ,
industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10
persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak
secara keseluruhan .
Negara maju membuat meningkatnya penggunaan teknologi
data-intensif . Ada 4,6 miliar langganan ponsel di seluruh dunia dan ada antara
1 miliar sampai 2 miliar orang mengakses internet . Antara tahun 1990 dan 2005
, lebih dari 1 miliar orang di seluruh dunia memasuki kelas menengah yang
berarti semakin banyak orang yang memperoleh uang akan menjadi melek lagi yang
pada gilirannya menyebabkan pertumbuhan informasi . Kapasitas yang efektif di
dunia untuk bertukar informasi melalui jaringan telekomunikasi adalah 281
petabyte pada tahun 1986 , 471 petabyte pada tahun 1993 , 2,2 exabyte pada
tahun 2000 , 65 exabyte pada tahun 2007 dan diperkirakan bahwa jumlah lalu
lintas yang mengalir melalui internet akan mencapai 667 exabytes per tahun pada
tahun 2013.
(HOW)
IT logs Analytics
Penyimpanan
Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan
untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil
analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang
terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan
sebagai solusi masalah sistem.
Fraud Detection Pattern
Banyak digunakan dalam Bidang
keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan pengunaan
data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika
transaksi sedang berlangsung
Risk: Patterns for Modeling and
Management
Memberikan kempuaan pengunaan data
secara penuh dan analisis dalam pemodelan resiko dan menejemen resiko untuk
memberikan pengetahuan akan resiko dan penanggulangannya secara tepat dan
langsung
Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan
pemrosesan data secara langsung dari berbagai sumber(sensor), analisa dan
kemudahan dalam pengenalan noise untuk memisahkannya dari signal.
Simpulan (WHY)
Dapat disimpulkan bahwa big data sudah mulai dimanfaatkan
dan akan sangat berguna untuk dipahami lebih dalam untuk mengimbangi
perkembangan jaman ke arah teknologi dan analisis yang lebih praktis.
(WHEN)
Big
Data digunakan saat kita mengakses internet.
Setiap hari, kita menciptakan 2,5 triliun byte data - begitu
banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun
terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk
mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan
video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Kelompok : Ahmad Vicky Zulfikar
Adnan Fadhilah
Inas Lathifah