Aprendizaje de máquina implementado en el lenguaje de programación R para clasificar tweets, provenientes de la red social Twitter, de acuerdo a su puntuación cruda("Muy Positivo", "Positivo", "Neutral", "Negativo", "Muy Negativo"), de acuerdo a su subjetividad ("Positivo", "Negativo", "Neutral") y de acuerdo a sus emociones ("Alegría", "Disgusto", "Enojo", "Miedo", "Sorpresa", y "Tristeza"). Para lograr esto se utiliza un clasificador bayesiano ingenuo multinomial, el cual, dado dos conjuntos de palabras (uno que contiene una lista de palabras ligadas a su subjetividad y otro en el que se encuentran ligadas a una emoción) brinda una puntuación a un tweet dado y es categorizado. El código en este repositorio analiza específicamente a tres dispositivos móviles, el Apple Iphone X, el Samsung Galaxy Note 8, y el Google Pixel 2, de acuerdo a los tweets recabados relacionados con ellos entre el 1 de junio de 2017 hasta la fecha actual (en el caso de las imágenes almacenadas, hasta el 25 de noviembre de 2017).
Este trabajo fue elaborado como proyecto final para la materia de Aprendizaje de Máquina impartida en CETYS Universidad, Campus Tijuana. Fue compartido en este repositorio con el objetivo de servir como base y contribuir a futuros trabajos relacionados con esta temática. Siéntanse libres de utilizarlo y preguntar cualquier duda.
Desarrollado durante el periodo del 25 de septiembre de 2017 al 24 de noviembre de 2017.
Machine learning implemented in the programming language R to classify tweets, coming from the social network Twitter, according to its raw score ("Very Positive", "Positive", "Neutral", "Negative", "Very Negative") , according to their subjectivity ("Positive", "Negative", "Neutral") and according to their emotions ("Joy", "Disgust", "Anger", "Fear", "Surprise", and "Sadness"). To achieve this, a naive multinomial Bayes classifier is used, which, given two sets of words (one that contains a list of words linked to their subjectivity and another in which they are linked to an emotion) provides a score to a given tweet and is categorized. The code in this repository specifically analyzes three mobile devices, the Apple Iphone X, the Samsung Galaxy Note 8, and the Google Pixel 2, according to the tweets collected related to them between June 1, 2017 and the current date (in the case of the stored images, until November 25, 2017).
This work was developed as a final project for the subject of Machine Learning, taught at CETYS Universidad, Campus Tijuana. It was sharede on this repository with aim of serving as a base and contribuiting to future works related to this topic. Feel free to use it and ask any questions.
Developed during the period from september 25, 2017 to november 24, 2017.