Isi jadwal demo pada http://bit.ly/DemoFPBDT1617
Instalasi Apache Cassandra dan Solr
- Instalasi Apache Cassandra (atau dapat menggunakan yang ada di DS310).
 - Instalasi Apache Solr (atau dapat menggunakan yang ada di DS310).
 
Apache Cassandra
- Mencari dataset untuk dimasukkan ke dalam Apache Cassandra. Untuk memasukkan data dapat menggunakan script program (PHP, Python, dsb.), atau import dalam format ke CSV. Apabila menggunakan format CSV pastikan kolom ID sudah diisi dengan UUID atau TIMEUUID.
 
Apache Solr
- Memilih tabel yang akan dijadikan indeks pencarian teks.
 - Membuat konfigurasi schema indexing Solr.
 
Aplikasi (bebas menggunakan bahasa apapun, namun gunakan konsep OOP untuk memudahkan dalam proses CRUD)
- Membuat aplikasi CRUD dengan basis data Apache Cassandra.
 - Pada aplikasi ada fitur searching memanfaatkan Solr (min. 2 tabel untuk diindeks oleh Apache Solr).
 
- MovieLens Dataset
 - UCI KDD Archive -> cari yang bertipe teks.
 
Kerjakan course yang ada di [3] dengan judul DS201: DataStax Enterprise Foundations of Apache Cassandra™.
[1] http://cassandra.apache.org/
[2] http://www.guru99.com/cassandra-tutorial.html
[3] https://academy.datastax.com/courses
Ikuti kuliah tamu "Research in Text Mining" hari ini, Kamis 27 April 2017 jam 13.00-15.00.
- Buatlah rangkuman mengenai topik kuliah tamu tersebut dalam bentuk laporan (1-2 halaman A4).
 - Pada halaman berikutnya, tuliskan pendapat kalian mengenai beberapa pertanyaan berikut.
- Bagaimana mekanisme penyimpanan data dalam proses text mining skala besar? Apakah bisa menggunakan big data (Hadoop, Spark, dsb) atau basis data terdistribusi (basis data relasional)?
 - Bagaimana basis data terdistribusi dapat membantu dalam riset text mining?
 - Apa saja riset-riset yang sudah dicapai dalam text mining? Kira-kira riset apa yang bisa dikembangkan berdasarkan hasil-hasil riset text mining yang sudah ada saat ini?
 - Pertanyaan-pertanyaan lain yang mungkin diajukan saat kuliah tamu berlangsung.
 
 
Tugas dikumpulkan dalam bentuk hardcopy saat kuliah minggu depan.
Please choose your schedule here https://goo.gl/HynkCu
- M. T. Ozsu and P. Valduriez, Principles of Distributed Database Systems, Third Edition. New York: Springer, 2011.
 - S. K. Rahimi and F. S. Haug, Distributed Database Management Systems: A Practical Approach. Hoboken, New Jersey: John Wiley & Sons, Inc., 2010.
 
- Oracle VirtualBox
 - MySQL, MySQL Fabric, MySQL Cluster
 - MariaDB, Galera Cluster
 - NoSQL Database (MongoDB and Cassandra)
 - MongoDB Atlas account