Webopinion, la herramienta definitiva para el seguimiento y análisis de la Reputación Online de tu empresa

28 Jun 2010

Aproximaciones Actuales para el Cálculo de Polaridad (II)

13:16H

Clasificación del Sentimiento a Nivel de Frase

Los mismos métodos de clasificación explicados en el post sobre la “Clasificación de Sentimiento a Nivel de Documento”, puede aplicarse también a frases individuales. Aunque normalmente en la literatura no se suele asumir que cada frase contenga una opinión. Así que, en estos casos, también es necesaria la tarea previa para clasificar las frases como subjetivas (con opinión) u objetivas. Las frases seleccionadas como poseedoras de opiniones son posteriormente también clasificadas como opiniones positivas o negativas, lo que se llama clasificación de sentimiento de nivel de frase.

De este modo, dada una frase se deben realizar dos subtareas:

  • Clasificación de subjetividad: Determinar si es una frase subjetiva o una frase objetiva.
  • Clasificar la polaridad de la frase: Si es subjetiva, clasificarla como positiva o negativa.

Ambos son problemas de clasificación, por lo que de esta forma los métodos tradicionales de aprendizaje supervisado son aplicables.

Sin embargo sigue existiendo una limitación, y es el supuesto que se suele hacer casi siempre de que una frase sólo lleva asociada una opinión, cosa que como mucho podría asumirse en frases simples.

Por ello es interesante tratar de separar las frases complejas en frases simples utilizando técnicas de NLP (Natural Language Processing). Sin embargo ello no siempre es una tarea sencilla y conlleva otras problemáticas, como al realizar la separación, el que pueden aparecer frases sin sujetos que posteriormente habrá que resolver. Así, la resolución de sujetos omitidos complica aún más la labor de asignación de polaridad.

ANÁLISIS DE SENTIMIENTO BASADO EN CARACTERÍSTICAS

Pese a que clasificar textos con opiniones a nivel de documento o frase es útil en muchos casos, no ofrecen el detalle necesario para otras aplicaciones. Un documento con una opinión positiva sobre un objeto en particular no significa que el autor tenga opiniones positivas en todos los aspectos o características del objeto, de la misma forma que una opinión negativa no significa que al autor le desagrade todo.

En un texto con opinión típico, el autor escribe aspectos negativos y positivos del objeto, aunque la opinión general sobre el objeto sea finalmente positiva o negativa. La clasificación a nivel de documento o frase no es capaz de ofrecer esta información. Para obtener ese detalle es necesario ir al nivel de característica del objeto.

Así sería necesario:

  • Identificar o extraer las características de los objetos que tienen comentarios.

Los estudios actuales en la extracción de características se llevan a cabo generalmente para reseñas online de productos. Existen dos formatos principales de reseñas/críticas en la Web.

  • Pros, contras y reseña detallada: De esta forma el autor describe de forma general los Pros y Contras de manera separada y posteriormente escribe una detallada reseña.
  • Formato libre: El autor escribe libremente sobre el objeto sobre el que vierte una opinión.
  • Determinar si las opiniones de esas características son positivas, negativas o neutras.

Para identificar la orientación de la opinión los métodos de clasificación usados en el nivel de frase y clausula son aplicables. Así, pueden ser aplicados a cada frase o clausula que contenga las características del objeto, y esas características cogerán la orientación de la opinión.

NOTA: A parte de las frases que expresan de forma directa la positividad o negatividad de una opinión de un objeto o de una característica de éste, comparar el objeto con otro puede ser otra forma de expresar una opinión. Las comparaciones están relacionadas pero son algo diferentes de las opiniones directas. No solo tienen una forma sintáctica diferente sino que también tienen un significado semántico diferente. Por ejemplo, una opinión directa podía ser “La aceleración que tiene este coche es increíble”, mientras una comparativa típica podría ser “La aceleración de tu coche es mucho mejor que la del suyo”.

El tratamiento por tanto de este tipo de frases es distinto, y muchas de las herramientas existentes en el mercado no las evalúan, al contrario que WebOpinion que realiza este análisis pormenorizado de todos los elementos de opinión que aparecen en los textos, incluyendo los comentarios.

21 Jun 2010

Webopinion, Una Excelente Herramienta Para Gestionar La Reputación Online De Empresas, Productos y Personas

10:02H

Hace ya unos cuantos años, un amigo me comentó que en la empresa de servicios donde estaba empleado, estaban trabajando para una Caja muy importante del país, facilitándoles unos reportes sobre su actividad online. Le comenté que me parecía una gran idea, identificar cuáles eran las noticias y opiniones más relevantes de la Caja y plasmarlas de manera ordenada en un papel. Le pregunté la metodología que utilizaban para obtener la información, pues me sonaba que alguna Compañía ya estaba trabajando en procesamiento del lenguaje natural y webmining. Mi amigo sonrió y me dijo: es una metodología muy antigua, contratamos a 6 becarios a tiempo parcial y se pasan horas y horas delante del ordenador. Luego copiamos los resultados y los pegamos en una plantilla de powerpoint predefinida. Le ponemos nuestro logotipo y se lo entregamos a la Caja.

Por aquel entonces comprendí la potencialidad del producto que había en la gestión de la reputación online, teniendo en cuenta la posibilidad de optimizar los procesos y los recursos y de  mejorar la metodología manual para la obtención de la información.

WebOpinion es el más claro ejemplo de la mejora evolutiva de la ORM (Online Reputation Management). Con WebOpinion la gestión de la reputación online ya es un hecho, pudiendo en un solo clic, sin ningún esfuerzo y de forma automática, saber lo que los clientes, proveedores y partners opinan en la red de una Compañía, Marca, Producto o Servicio. Esto lo consigue rastreando las principales fuentes de información online, contando con Blogs, Redes Sociales,Web 2.0 y Foros.

Los “economics” o beneficios de WebOpinion son muchos, comenzando por un ahorro de costes de operaciones acompañado de una mejora en la precisión y en el alcance de los resultados de búsqueda. Adicionalmente la herramienta, calcula de forma automática y mensualmente el IReON (Índice de Reputación Online), que permite monitorizar mes a mes cómo se encuentra la compañía/producto/marca/persona en cuanto a reputación online, siendo calculado mediante un algoritmo que conjuga matricialmente si se habla bien o mal de la compañía/marca/producto/persona, si se habla mucho o poco y la importancia de quién realiza los comentarios (si es alguien con autoridad y visibilidad en la red o no).

Una de las claras ventajas de WebOpinion es que acorta sensiblemente los tiempos de reacción por parte de los implicados ante una crisis o situación desfavorable. Adicionalmente permite identificar quiénes son los usuarios más activos y que difusión y visibilidad tiene sus comentarios.

Con WebOpinion las Compañías pueden estar más tranquilas, pudiendo identificar de forma rápida y flexible las opiniones que se vierten en la red acerca de sus marcas, productos, personas y de ellas mismas en su conjunto. Una vez detectadas, es necesario gestionarlo internamente o con el soporte de las agencias de comunicación, un pilar importante a la hora de gestionar las acciones correctivas en red.

Hoy mismo, en la hora actual, en este mismo instante pueden estar hablando de usted en la red, perjudicando su prestigio y su reputación. O por el contrario pueden estar hablando bien y recomendando a otros clientes las bondades de sus productos. En la medición de la reputación, no vale el refrán popular que dice: “Que hablen mal o que hablen bien, pero que hablen”. En la Gestión de la Reputación debemos buscar alcanzar la excelencia con el número máximo de post y comentarios positivos y minimizando al máximo los comentarios negativos que los usuarios comentan acerca de nosotros.

18 Jun 2010

Entrevista en Radio3 a nuestro Marketing Manager sobre Reputación Online

10:42H

El pasado 16 de junio se retransmitió a en el programa Siglo XXI de Radio3 una breve entrevista sobre WebOpinion, nuestra herramienta para la Gestión de Reputación Online.

En ella describimos nuestra visión sobre la presencia de las empresas en los medios online, así como las ventajas de la Gestión de la Reputación Online, y como WebOpinion cubre las necesidades de monitorización de los medios 2.0.

Clip de audio: Es necesario tener Adobe Flash Player (versión 9 o superior) para reproducir este clip de audio. Descargue la versión más reciente aquí. También necesita tener activado Javascript en su navegador.

Programa completo aquí

14 Jun 2010

Aproximaciones Actuales para el Cálculo de Polaridad (I). Clasificación de Sentimiento a Nivel de Documento

11:52H

Como ya se comentó en el post Búsqueda y Recuperación De Opiniones, calcular la polaridad de una opinión no es una tarea fácil, por lo que se han realizado diferentes estudios y aproximaciones a esta tarea.

CLASIFICACIÓN DE SENTIMIENTO A NIVEL DE DOCUMENTO

La primera de las aproximaciones y la más básica, consiste en clasificar un documento como una opinión positiva o negativa (por ejemplo, una crítica de una película). Esta tarea suele conocerse como clasificación de sentimiento a nivel de documento, ya que considera todo el documento como unidad básica de información.

En la clasificación de sentimiento a nivel de documento dado un conjunto de documentos D que contienen una opinión, se determina para cada documento d ∈ D si expresa una opinión positiva o negativa sobre un objeto. Los estudios y trabajos existentes actualmente en este área parten de la suposición de que el documento expresa una opinión sobre un único objeto y proviene de un sólo autor. Lo que hace sea aplicable sólo en contextos concretos,  por lo que para la mayorías de los casos reales no es aplicable ya que un documento rara vez contiene una sola opinión.

La mayoría de las técnicas de clasificación de sentimiento a nivel de documento están basadas en técnicas de aprendizaje supervisado, aunque también existen algunos métodos no supervisados.

Clasificación basada en aprendizaje supervisado (nivel de documento)

La clasificación de opiniones puede ser formulada como un problema de aprendizaje supervisado con dos clases de etiquetas (positivo y negativo). Suponiendo, como se ha comentado antes, que todos los documentos implican una opinión. Para los datos de entrenamiento y pruebas usados en los experimentos realizados hasta ahora se han utilizado principalmente críticas o reseñas que tienen una puntuación asignada por el autor (que normalmente está entre 1 y 5 estrellas). Según esto, se considera una opinión con 4 o 5 estrellas como positiva y una con 1 o 2 estrellas como negativa. Los métodos de aprendizaje supervisado existentes pueden ser aplicados de esta forma fácilmente a la clasificación de opiniones, por ejemplo, métodos como Naïve Bayes, SVM (Support Vector Machines) o Maximum Entropy han sido utilizados con “buenos” resultados.

Algunos experimentos simples que utilizaron esta aproximación, comenzaron usando unigramas (palabras individuales) como característica, con métodos como Naïve Bayes o SVM. Así mediante los entrenamientos se obtenía un clasificador que basándose en el conjunto de unigramas que aparece típicamente en documentos negativos y el que aparece en los documentos positivos, era capaz de asignar una polaridad (positiva o negativa) a un documento. De esta forma, comprobando si los unigramas del documento a clasificar se aproximan más a los unigramas que típicamente (basándose en los documentos del entrenamiento) definen los documentos positivos o a los negativos, se le asignará una polaridad u otra.

Sin embargo esta aproximación tiene algunas debilidades, entre ellas el que no es capaz de detectar ni tener en cuenta negados. Debido a que, por ejemplo, la palabra “no” estará tanto en opiniones positivas como negativas, por lo que no será determinante para identificar polaridad. Y por tanto al valorar un documento que, por ejemplo, este formado sólo por la frase “no es bueno”, el clasificador encontrará como palabra determinante de la polaridad a “bueno”, que aparentemente la clasificará como positiva, por lo que clasificará el documento como positivo, ya que las otras dos palabras probablemente no tengan carga de polaridad para el clasificador. Lo que a priori parece que sería un error, ya que sin contexto parece una opinión negativa.

Para intentar subsanar esta limitación existen experimentos que realizan un preprocesado de los documentos y así introducir la negación en el unigrama, de forma que la frase “no es bueno” sea transformada a “es no_bueno”. De forma que al entrenar el clasificador, “no_bueno” éste lo asocie más con opiniones negativas, mientras que “bueno” lo asocie con positivas.

Otros experimentos utilizan bigramas y trigramas para considerar expresiones con más de una palabra (por ejemplo, “ir como un tiro”, que en un contexto de velocidades de Internet sería positivo).

Bo Pang que utilizó está aproximación para clasificar opiniones de películas en dos categorías, positivas y negativas (descartando las opiniones neutras), obteniendo resultados cercanos al 83% de precisión utilizando como método SVM. En sus experimentos utilizó como características: unigramas, bigramas, etiquetas POS, la etiqueta de la negación y la posición de las palabras.

Otros autores y experimentos, antes de los procesos de entrenamiento y clasificación, realizan labores de preprocesado en las que se eliminan de los documentos las palabras más frecuentes del idioma mediante una lista de stop-words (palabras vacías) para no tenerlas en cuenta, y se realiza lematización o stemming sobre las palabras.

En todos estos casos, normalmente el ruido que mete la parte del documento donde no se habla del objeto que se está valorando hace que salgan resultados no muy precisos. Como solución a esto se pueden utilizar ventanas de acción, aplicándose los métodos de clasificación al texto que se encuentra alrededor de las ocurrencias Keywords del documento que identifican al objeto del que se desea obtener la opinión.

Uno de los principales problemas con los que se debe contar al usar cualquier método de aprendizaje supervisado es el esfuerzo manual de anotación que requiere para entrenar el sistema.

leer más…

08 Jun 2010

El Paradigma Empresarial Del S.XXI: La Gestión De La Reputación Parte 2

10:36H

Continuando con el análisis de la reputación , ¿Cómo pueden afectar estos comentarios negativos a la reputación de una Compañía? Los seres humanos somos extraños. Nos focalizamos más en lo negativo que en lo positivo. Cuando a una persona le sucede un evento positivo, en media lo comunica a 3 personas, mientras que cuando le sucede un evento negativo, lo comunica en media a 11. ¿Estamos locos o somos masocas? Desconozco la respuesta a esa pregunta. Pero la verdad es que es necesario gestionar esa cadena de mensajes negativos que en muchas ocasiones puede convertirse en la pesadilla de una Compañía, de una Marca, de un Producto o de una Persona mismamente, perjudicando su reputación frente a terceros.

Por esta razón, una Compañía debe cuidar su reputación como si de su propia subsistencia se tratara. Y más allá, la Reputación empresarial es un aspecto crucial para soñar con el liderazgo empresarial, exige un esfuerzo literal en diversas materias que incluye la responsabilidad social corporativa, la calidad de sus productos, la publicidad responsable, la verdad de los procesos de comunicación, la franqueza de las personas que representan a la Compañía, las políticas de empleados, su valoración en el canal online…todo suma en la radiografía del cliente y su ojo clínico.

Por este motivo es condición necesaria, pero no suficiente, el mantener satisfechos a los clientes, fidelizarles y gestionar su valor mediante tratamientos personalizados y diferenciados. A los clientes no se les puede engañar ni ponerles una zanahoria delante. El cliente escoge, prueba, consume, juzga y comunica. Y es capaz de retar a las Organizaciones cuando no se siente plenamente convencido. La Reputación convence y la falta de la misma “vence sin convencer”.

Llegado el año 2010, los niños llegan al mundo con Internet debajo de un brazo y en el otro con un móvil. La web 2.0 se ha establecido en nuestras vidas y yo con mis 40 me he encariñado con las formas y el fondo. Redes sociales, wikis, blogs, foros, aplicaciones para móviles quizás impensables hace unos años. Toda la máquina se ha puesto en marcha para que nuestra voz en forma de letras llegue a cualquier rincón del mundo y que cualquier persona pueda leernos, interiorizar y juzgar nuestras palabras. Y con ello nos hemos convertido en jueces de las Compañías, pudiendo alquilar al mes unos megáfonos especiales, a 25 euros los 3 megas garantizados y a 20 euros de tarifa plana móvil. La tecnología nos ha brindado una excelente oportunidad como clientes para compartir en la red nuestras experiencias vitales y también nos ha brindado una excelente oportunidad como empresarios para gestionar dicha reputación empresarial a través de herramientas específicas que nos ayuda a identificar rápidamente los focos de los problemas.

Hablando de herramientas y teniendo en cuenta esta facilidad para opinar online sobre las Compañías, Marcas, Productos y Personas, ¿cómo podemos gestionar los procesos de comunicación online de miles de consumidores y usuarios, que pueden dar su opinión en diversas fuentes y manifestarse de una forma ordenada y libre? La respuesta a esta pregunta se llama WEBOPINION y es la herramienta más fiable de gestión de la reputación online que describo en el siguiente post.

24 May 2010

El Paradigma Empresarial Del S.XXI: La Gestión De La Reputación Parte 1

15:28H

REAL ACADEMIA ESPAÑOLA (RAE)
reputación.
(Del lat. reputatĭo, -ōnis).
1. f. Opinión o consideración en que se tiene a alguien o algo.
2. f. Prestigio o estima en que son tenidos alguien o algo.

Ya desde los primeros días del esperanzador año 2000, cuando todavía no cernía sobre nuestra capa de materia gris la sombra de la crisis (por cierto tan alargada como la del ciprés), hablaba yo en mis seminarios, dirigidos a directivos de marketing de relevantes compañías españolas, sobre la “palabra empresarial” del siglo XXI, que a mi juicio engloba muchas otras acepciones: La Reputación.

Allá por mitad de los 90, cuando Internet no era más que un módem a 56k y un Netscape Navigator y  mi teléfono móvil ocupaba (y pesaba) casi como un MacBook Pro actual , las Compañías de Servicios comenzaban a ocuparse de la satisfacción del cliente y la mejora de la calidad de servicio. Todo un reto pensar que un lector del gas, cuando llamaba a tu puerta para hacer la lectura, se iba a poner patucos de plástico en sus botas llenas de barro para no manchar tu preciosa alfombra traída de la misma Persia años atrás.

Reto cumplido, las Compañías ponían el foco en la Satisfacción de los Clientes y trataban de identificar, cuantitativa y cualitativamente, cuáles eran los principales motivos de satisfacción y sobre todo de insatisfacción y evaluaban qué impacto tendrían sobre su “felicidad” como cliente de la Compañía, es decir, cuanto de fiel sería el cliente una vez se corrigiesen esas deficiencias que generaban su insatisfacción. Todo ello a través de técnicas cuantitativas (análisis factorial, regresión múltiple) y cualitativas, como los Focus Groups de clientes.

Así, con el tiempo y recién estrenado el año 2000, las mismas Compañías ya tenían dominada la monitorización de la satisfacción de los clientes y comenzaron trabajar sobre la Fidelización, a premiar y fidelizar a los clientes, para mantener una base de clientes leales y que a su vez se incrementaba a medida que se afianzaba lo que los consultores llamábamos el “Word of Mouth” o el “boca a boca”. Yo siempre preferí llamarlo “boca a oreja”. El cliente satisfecho era además fiel, porque comenzaron a surgir los programas de fidelización, basados todos ellos en el “efecto gemini”, con una importante carga emocional y otra racional y económica, normalmente en forma de puntos que podían canjear por artículos, cuando menos curiosos. Cliente satisfecho, cliente fiel, cliente que comunica su felicidad a otros potenciales clientes…clientes que finalmente consideran que una Compañía tiene la suficiente reputación como para seguir sirviéndole como proveedor. leer más…

21 May 2010

¿Por Qué Surge La Minería De Opinión? ¿Qué Necesidades Pretende Cubrir?

10:02H

La creciente popularidad de sitios ricos en opiniones, como blogs, redes sociales y sitios de recomendaciones, abre nuevas oportunidades y retos al poderse usar diferentes técnicas para entender y extraer las opiniones de otros. Con este objetivo se ha invertido mucho esfuerzo en áreas como la minería de opinión (opinion mining) y el análisis de sentimiento (sentiment analysis), que centrar sus esfuerzos en el tratamiento computacional de opiniones, sentimiento y subjetividad en el texto. Las interesantes aplicaciones de esto han provocado que se haya producido una explosión en el número de empresas que ofrecen servicios de análisis de sentimiento, en Estados Unidos a día de hoy existen al más de 30 compañías dedicadas a ello.

La explosión de la llamada Web 2.0 ha producido que la cantidad de información compartida en la web se dispare, debido a blogs, redes sociales y páginas de colaboración.

La información existente puede ser clasificada de manera genérica en dos tipos principales que son: hechos y opiniones. Los hechos son expresiones e informaciones objetivas sobre entidades, eventos y sus propiedades. Las opiniones, por su parte, son expresiones subjetivas que describen sentimientos, sensaciones y valoraciones sobre entidades, eventos y propiedades.

Las opiniones son una información muy valiosa tanto desde el punto de vista de un usuario particular como desde el punto de vista del departamento de marketing de una empresa. Desde el punto de vista de un usuario es interesante antes de realizar una compra comprobar qué opinan otros usuarios sobre dicha marca, producto o servicio. Desde el punto de vista empresarial, tiene una especial importancia debido a que para una empresa resulta vital conocer lo que piensan los usuarios sobre las virtudes y debilidades de sus productos y servicios, así como a qué grupos llegan.

Uno de los motivos principales por lo que no se había invertido demasiado esfuerzo en el estudio de opiniones anteriormente es debido a que antes de la Web existía poco texto con opiniones. De esta forma, antes de que se expandiera la Web, cuando alguien necesitaba tomar una decisión pedía opinión a amigos y familiares. Y cuando una empresa quería buscar información sobre opiniones o sentimientos del público sobre sus productos y/o servicios, acudía a encuestas de opinión, sondeos y análisis de grupos. Sin embargo con la Web, especialmente con el crecimiento exponencial del contenido generado por los usuarios en la Web en los últimos años, muchas cosas han cambiado.

Actualmente si alguien quiere comprar un producto determinado, no está limitado a preguntar únicamente a sus amigos y familiares, ya que existen numerosas opiniones sobre productos en la Web que muestran la valoración del producto para diferentes usuarios. Para una compañía, puede no ser necesario dirigir encuestas, o contratar gente conseguir opiniones de clientes sobre sus productos y aquellos competidores, porque el contenido generado en la Web puede darles esa información.

leer más…

20 May 2010

Búsqueda y Recuperación De Opiniones

18:17H

Al igual que la búsqueda web, que se ha demostrado que actualmente es de vital importancia, no es difícil imaginar que la búsqueda de opinión también puede ser de gran utilidad. Una vez rastreado el contenido generado en la Web para un determinado objeto, se puede ofrecer un sistema que permita buscar opiniones o información subjetiva.

Existen dos formas típicas en que las consultas pueden ser realizadas:

  1. Encontrar opiniones públicas sobre un objeto o característica en particular de un objeto. Pudiéndose ser el objeto un producto, persona, organización, evento o tópico.
  2. Encontrar opiniones de una persona u organización para un objeto o característica de un objeto en particular. Este tipo de búsqueda es particularmente interesante en artículos y contextos donde las personas u organizaciones que expresan la opinión es explícitamente indicado. Así, por ejemplo, se podría saber qué opina Obama sobre otro político o sobre una marca en particular.

Sin embargo, no es posible identificar el autor en todas las opiniones de la Web. Por lo que esta opción de búsqueda sólo es viable si se rastrean determinadas fuentes donde se incluya el autor de la opinión.

De forma similar a la búsqueda web tradicional, la búsqueda de opiniones tiene dos tareas principales:

  1. Recuperar documentos/frases relevantes para una consulta de un usuario
  2. Ordena los documentos/frase por orden de relevancia o por alguna otra propiedad (autor, fecha, polaridad, ..).

Sin embargo, también existen grandes diferencias. En la recuperación, la búsqueda de opiniones necesita realizar dos tareas adicionales:

  1. Encontrar documentos o frase que son relevantes para el tema de la consulta.
  2. Determinar si un documento o frase expresa una opinión y si ésta es positiva o negativa. Esta tarea es exclusiva del análisis de sentimiento y hace que la búsqueda de opinión sea más compleja que la búsqueda tradicional.

Importantes empresas trabajan para madurar y mejorar las técnicas actuales de cálculo de polaridad, con el objetivo de crear un sistema de recuperación de opiniones sólido y todo lo genérico posible, que pueda ser un referente, como lo es Google en la recuperación de información. Productos como WebOpinion tratan de conseguir esta tarea, implementando algoritmos que pretenden dar una nueva vuelta de tuerca al mundo del marketing actual.

WebOpinion

WebOpinion la herramienta definitiva para el seguimiento y análisis de la Reputación Online de tu empresa