KONSEP SISTEM INFORMASI Big Data Processing H-Grid 247

July 25, 2017 | Autor: Rizky Ikhsan | Categoria: Hadoop, Big Data, Konsep Sistem Informasi
Share Embed


Descrição do Produto

KONSEP SISTEM INFORMASI
Big Data Processing
H-Grid 247




Kelompok:
Rizky Ikhsan 41812120232
Anisa Dwi Demiwati 41813120113


Pendahuluan
Latar Belakang
Perkembangan jaman hingga saat ini sangat berdampak besar terhadap kehidupan sekarang. Salah satu hal yang berubah adalah cara menggunakan data. Hal tersebut sangat dipengaruhi oleh perkembangan teknologi, karena dapat dilihat sekarang penggunaan tiap individu terhadap data sudah sangat tinggi, hampir semua orang memiliki data dalam setiap perangkatnya (komputer / laptop, smartphone, flashdisk, harddisk eksternal, dll) yang jika dijumlahkan akan menjadi besar sekali. Sekarang dengan terjadinya perkembangan teknologi, data menjadi hal yang penting dalam menjalankan berbagai hal, beberapa diantaranya; mengetahui tren pasar, mengetahui keinginan konsumen saat ini, meningkatkan hasil penjualan, dll.
Dengan perkembangan data inilah big data muncul dan saat ini mulai berkembang. Penggunaannya pun semakin luas, hingga mencakup social media, sehingga dapat menganalisa tren pasar dengan melihat sentimen analisis pelanggan melalui social media. Dengan perkembangan saat ini, ada baiknya untuk memahami lebih dalam mengenai big data, sehingga dapat dimanfaatkan dengan lebih maksimal.

Pengertian
Data
(R. Kelly Rainer, 2011) Data, menunjuk pada deskripsi dasar akan benda, event, aktivitas, dan transaksi yang terdokumentasi, terklasifikasi,dan tersimpan tetapi tidak terorganisasi untuk dapat memberikan suatu arti yang spesifik.

Information
(R. Kelly Rainer, 2011) Information, merupakan data yang telah terorganisir agar dapat memberikan arti dan nilai kepada penerima.

Data Warehouse
(R. Kelly Rainer, 2011) Data Warehouse adalah repository dari data-data yang bersifat historical yang terorganisir berdasarkan subjek yang digunakan untuk mendukung pengambilan keputusan. Data warehouse memiliki beberapa karakter dasar seperti. Diatur oleh business dimension atau subject dimana data disusun berdasarkan subjeknya dan memiliki informasi yang relevan dengan pemgambilan keputusan dan analisis data. Consistent yaitu data memliki bentuk yang sama disetiap atau disemua database. Historical, data yang ada merupakan data yang tersimpan dan terkumpul dalam waktu yang lama yang digunakan untuk forecasting dan perbandingan untuk melihat tingkat laju suatu perusahaan. Use only analytical processing menggunakan analytical processing yang berguna unutk mengakumulasi data-data yang ada. Multidimensional, data warehouse menyimpan data dalam lebih dari dua dimensi seperti data cube.

Pembahasaan

Tools Big Data – Hgrid 247
Adalah sebuah tools yang sangat membantu untuk pengerjaan dalam memproses big data atau batch data processing. Bisa disebut juga sebagai tercepat dan yang terefisien untuk Big Data processing dan tools pertama di dunia yang mampu melakukan generate Map Reduce Code dari Hadoop. Pemrosesan ini berjalan pada cluster-cluster Hadoop. Hadoop sendiri artinya open source framework untuk distribusi aplikasi yang memproses data yang sangat besar.
HGRID telah dilengkapi dengan pengolahan data perpustakaan untuk agregasi, penyaringan, proses pemisahan, mengubah, parsing dan banyak lagi untuk menghindari / kurang coding. HGRID memiliki user interface yang memungkinkan pengguna untuk mengklik dan drag untuk membuat aliran pengolahan data dan secara otomatis menghasilkan kode dan mengeksekusi kode pada prosesor didistribusikan secara paralel.

Gambar 1. Hadoop Cluster

Komponen – komponen yang ada dalam hadoop :
Name Node
Data Node
Secondary Name Node
Job Tracker
Task Tracker

Map Reduce adalah adalah model pemrograman untuk pemrosesan data dengan volume yang besar secara parallel dengan cara membagi task (tugas) secara independent. Setiap task di-dekomposisi ke dalam mapper dan reducer

Gambar 2. Map Reduce Hadoop

Kembali ke tools Hgrid 247, fitur – fitur utama yang bisa kita gunakan adalah :
Drag and drop workflow design
Custom transformation
Custom aggregation
Custom function
Java source code generator
Executable map reduce generator
Log record generator
Berikut kapabilitas dari tools tersebut :
Meningkatkan produktivitas dengan menggunakan "drag & drop" karena berbasis GUI
Secara otomatis menghasilkan kode
Regex, Sort, Agregat, Gabung, Grup, Cabang, Filter, Binary Konversi, Load / Baca ke DB / datar File, dll sudah ada
Fungsi tambahan dapat dengan mudah ditulis dan ditambahkan sebagai UDF di Java (sederhana dan mudah, tidak perlu belajar bahasa baru / script)
Operator statistik dan data mining berdasarkan weka and rapid miner library
Pengguna dapat mengembangkan dan menguji menggunakan PC atau Laptop (di rumah) atau lingkungan pengembangan lain, kemudian setelah selesai menyerahkan kepada produksi Hadoop Grid Cluster


Gambar 3. Workflow Hgrid 247



Daftar Pustaka
R. Kelly Rainer, C. (2011). Introduction to Information Systems. John Wiley & Sons (Asia) Pte Ltd.
http://www.solusi247.com/index.php/productitsolution/2013-03-27-08-39-53/h-grid-247.html
http://www.solusi247.com/index.php/rcsradar/2013-03-27-10-14-10/big_data_framework.html
http://forum.idbigdata.com/

Lihat lebih banyak...

Comentários

Copyright © 2017 DADOSPDF Inc.