Kamis, 13 November 2014

CASE STUDY BIG DATA

Pengertian Big Data (WHAT)
Big data adalah volume tinggi , kecepatan tinggi , dan / atau berbagai tinggi aset informasi yang memerlukan bentuk-bentuk baru pengolahan untuk memungkinkan pengambilan keputusan ditingkatkan , wawasan penemuan dan optimasi proses. "Big Data didefinisikan sebagai sebuah problem domain di mana teknologi tradisional seperti relational database tidak mampu lagi untuk melayani. Definisi Big di sini adalah volume, velositas dan variasi datanya.
Menurut (Eaton, Dirk, Tom, George, & Paul) Big Data merupakan istilah yang berlaku untuk informasi yang tidak dapat diproses atau dianalisis menggunakan alat tradisional.
Menurut (Dumbill, 2012) , Big Data adalah data yang melebihi proses kapasitas dari kovensi sistem database yang ada. Data terlalu besar dan terlalu cepat atau tidak sesuai dengan struktur arsitektur database yang ada. Untuk mendapatkan nilai dari data, maka harus memilih jalan altenatif untuk memprosesnya.

(Cannolly, 2012)
Pengunaan Big Data (WHO dan WHERE)
Big data digunakan oleh semua kalangan dari instansi pemerintahan sampai lembaga masyatakat dan digunakan juga oleh lembaga swasta yang sekarang sudah menjadi sukses dengan menggunakan Big data berikut ini contoh penggunaan Big data:
1Contoh Pemerintah
    Pada tahun 2012 , pemerintahan Obama mengumumkan Big Data Penelitian dan Pengembangan Inisiatif , yang mengeksplorasi bagaimana data besar bisa digunakan untuk mengatasi masalah-masalah penting yang dihadapi oleh pemerintah . Inisiatif ini terdiri dari 84 program big data yang berbeda yang tersebar di enam departemen .
    Analisis data besar memainkan peran besar dalam kampanye Barack Obama sukses 2012 pemilihan ulang .  Amerika Serikat Pemerintah Federal memiliki enam dari sepuluh superkomputer paling kuat di dunia. Utah Data Center adalah pusat data saat ini sedang dibangun oleh Amerika Serikat National Security Agency . Ketika selesai , fasilitas tersebut akan mampu menangani Yottabytes informasi yang dikumpulkan oleh NSA melalui Internet.
2.     Contoh  di Sektor  Swasta
    eBay.com menggunakan dua gudang data pada 7,5 petabyte dan 40PB serta Hadoop klaster 40PB untuk pencarian, rekomendasi, konsumen, dan merchandising . Di dalam eBay 90PB data warehouse.
    Amazon.com menangani jutaan operasi back-end setiap hari, serta pertanyaan dari lebih dari setengah juta penjual pihak ketiga . Teknologi inti yang membuat Amazon berjalan adalah berbasis Linux dan pada 2005 mereka memiliki tiga database Linux terbesar di dunia , dengan kapasitas 7,8 TB , 18,5 TB , dan 24,7 TB. Walmart menangani lebih dari 1 juta transaksi nasabah setiap jam , yang diimpor ke database diperkirakan mengandung lebih dari 2,5 petabyte ( 2.560 terabyte ) data - . Setara dengan 167 kali informasi yang terdapat dalam semua buku di Perpustakaan Kongres AS.
    FICO Falcon Penipuan Kartu Kredit Detection System melindungi 2,1 miliar akun aktif di seluruh dunia .
    Volume data bisnis di seluruh dunia , di semua perusahaan , dua kali lipat setiap 1,2 tahun , menurut perkiraan.
    Windermere Real Estate menggunakan sinyal GPS anonim dari hampir 100 juta driver untuk membantu pembeli rumah baru menentukan waktu berkendara khas mereka ke dan dari tempat kerja di berbagai kali dalam sehari .
3.     Contoh di Bidang Arsitektur
Pada tahun 2004 , Google menerbitkan sebuah makalah tentang proses yang disebut MapReduce yang menggunakan arsitektur tersebut . MapReduce framework menyediakan model pemrosesan paralel dan implementasi terkait untuk memproses sejumlah besar data . Dengan MapReduce , query dibagi dan didistribusikan di seluruh node paralel dan diproses secara . Hasilnya kemudian dikumpulkan dan disampaikan. Kerangka itu sangat sukses sehingga orang lain ingin meniru algoritma . Oleh karena itu , sebuah implementasi dari kerangka MapReduce diadopsi oleh sebuah proyek open source Apache Hadoop bernama        Teknologi Topological Program Analisis Data DARPA.
4.     Contoh di Bidang Pasar
 " Big Data " telah meningkatkan permintaan spesialis manajemen informasi dalam Software AG , Oracle Corporation , IBM , Microsoft , SAP , EMC , HP dan Dell telah menghabiskan lebih dari $ 15 miliar untuk perusahaan perangkat lunak hanya mengkhususkan diri dalam manajemen data dan analisis . Pada tahun 2010 , industri ini sendiri bernilai lebih dari $ 100 miliar dan tumbuh hampir 10 persen per tahun, tentang dua kali lebih cepat sebagai bisnis perangkat lunak secara keseluruhan .
Negara maju membuat meningkatnya penggunaan teknologi data-intensif . Ada 4,6 miliar langganan ponsel di seluruh dunia dan ada antara 1 miliar sampai 2 miliar orang mengakses internet . Antara tahun 1990 dan 2005 , lebih dari 1 miliar orang di seluruh dunia memasuki kelas menengah yang berarti semakin banyak orang yang memperoleh uang akan menjadi melek lagi yang pada gilirannya menyebabkan pertumbuhan informasi . Kapasitas yang efektif di dunia untuk bertukar informasi melalui jaringan telekomunikasi adalah 281 petabyte pada tahun 1986 , 471 petabyte pada tahun 1993 , 2,2 exabyte pada tahun 2000 , 65 exabyte pada tahun 2007 dan diperkirakan bahwa jumlah lalu lintas yang mengalir melalui internet akan mencapai 667 exabytes per tahun pada tahun 2013.
(HOW)
          
IT logs Analytics
        Penyimpanan Log jangka panjang, digunakan untuk analisa proses sistem yang sedang berjalan untuk mencegah dan menaggulangi kegagalan dalam sistem, mengunakan hasil analisa log untuk menemukan dan mentukan secara pasti kegagalan apa yang terjadi didalam sistem, menyiapkan langkah-langkah pasti yang dapat digunakan sebagai solusi masalah sistem.
    Fraud Detection Pattern
Banyak digunakan dalam Bidang keuangan atau dimana saja transaksi finasial terlibat, Memaksimalkan pengunaan data-data yang ada untuk memberikan kemampuan unutk mendeteksi fraud ketika transaksi sedang berlangsung
    
   Risk: Patterns  for Modeling and Management
Memberikan kempuaan pengunaan data secara penuh dan analisis dalam pemodelan resiko dan menejemen resiko untuk memberikan pengetahuan akan resiko dan penanggulangannya secara tepat dan langsung 
Big data and The Energy Sector
Memberikan kemampuan penyimpanan dan pemrosesan data secara langsung dari berbagai sumber(sensor), analisa dan kemudahan dalam pengenalan noise untuk memisahkannya dari signal.
 

Simpulan (WHY)
Dapat disimpulkan bahwa big data sudah mulai dimanfaatkan dan akan sangat berguna untuk dipahami lebih dalam untuk mengimbangi perkembangan jaman ke arah teknologi dan analisis yang lebih praktis.
(WHEN)
        Big Data digunakan saat kita mengakses internet.
Setiap hari, kita menciptakan 2,5 triliun byte data - begitu banyak bahwa 90% dari data di dunia saat ini telah dibuat dalam dua tahun terakhir saja. Data ini berasal dari mana-mana, sensor digunakan untuk mengumpulkan informasi iklim, posting ke situs media sosial, gambar digital dan video, catatan transaksi pembelian, dan sinyal ponsel GPS untuk beberapa nama.
Kelompok : Ahmad Vicky Zulfikar
             Adnan Fadhilah
             Inas Lathifah