Inteligencia Artificial en la clasificación de videos
Mejorando la forma en que se organizan los videos con Machine Learning
Netra, cofundada por Shashi Kant SM '06, utiliza inteligencia artificial para ayudar a las empresas a clasificar y administrar el contenido de video
by Overstand, 07/10/2021
Actualmente en todo momento se publican muchos miles de videos como en YouTube, TikTok e Instagram. Muchos de esos videos son en directo y se trata de comprender que sucede con todo ese contenido. Y es precisamente aquí donde entra la Inteligencia Artificial y el Machine Learning.
Para eso se creó Netra, fundada por ex alumnos del MIT. Esta está utilizando IA para mejorar el análisis de video a escala. Con esto la IA es capaz de reconoces actividades, objetos, emociones, ubicaciones y de más para organizar y proporcionar contexto a los videos.
Netra se utiliza para agrupar contenido y señalar desnudez, violencia y gestionar la colocación de anuncios. En el sector de la publicidad, Netra es muy útil para garantizar que los videos tienen publicación acorde con su contenido, sin la necesidad de que las marcas rastreen personas individuales.
El cofundador y director de tecnología de Netra, Shashi Kant, dijo "La industria en su conjunto está girando hacia la publicidad basada en contenido, o lo que ellos llaman publicidad de afinidad, y se aleja del seguimiento basado en cookies y píxeles, que siempre fue algo espeluznante"
Netra también es útil para poder catalogar los videos mediante palabras clave y así encontrar el contenido esperado de manera sencilla.
Por ejemplo, el sistema de Netra puede procesar los videos de una temporada de béisbol y ayudar a los usuarios a encontrar todos los sencillos. Al hacer clic en ciertas jugadas para ver más similares, también pueden encontrar todos los sencillos que estaban casi eliminados y llevaron a los fanáticos a abuchear con enojo.
Según Kant, “El video es, con mucho, el mayor recurso de información en la actualidad”, “Eclipsa el texto en órdenes de magnitud en términos de riqueza y tamaño de la información, pero nadie lo ha tocado ni siquiera con la búsqueda. Es el espacio en blanco más blanco ".
Persiguiendo una visión
El pionero de Internet y profesor del MIT, Sir Tim Berners-Lee, ha trabajado mucho tiempo para mejorar la capacidad de las máquinas para dar sentido a los datos de internet. Kant investigó Berners-Lee como estudiante de postgrado y se inspiró en su visión de mejorar la forma en la que las máquinas almacenan y utilizan la información.
Kant añadió, “Para mí, el santo grial es un nuevo paradigma en la recuperación de información”, “Siento que la búsqueda en la web todavía es 1.0. Incluso Google es 1.0. Esa ha sido la visión de la iniciativa de la web semántica de Sir Tim Berners-Lee y eso es lo que tomé de esa experiencia ".
Después de graduarse, Kant fundo una empresa que utilizaba IA, llamada Cognika. Como en ese momento la Inteligencia Artificial estaba sobre valorada, Kant usaba términos como computación cognitiva al referirse a la labor de su empresa.
En 2013 todo cambió, puesto que Kant fundó Netra y la situación era al revés, ya que todo el mundo afirmaba el uso de Inteligencia Artificial en sus startups.
Netra permite analizar videos rápidamente y organizar su contenido, tanto con sus clips como con sus escenas similares. El análisis de Netra genera metadatos para diferentes escenas, pero Kant dice que el sistema de Netra proporciona mucho más que el etiquetado de palabras clave.
Kant explicó: “Con lo que trabajamos son las incrustaciones”, “Si hay una escena en la que alguien pega un jonrón, hay una cierta firma en eso, y generamos una incrustación para eso. Una incrustación es una secuencia de números, o un 'vector', que captura la esencia de un contenido. Las etiquetas son solo representaciones legibles por humanos de eso. Entonces, entrenaremos un modelo que detecte todos los jonrones, pero debajo de la cubierta hay una red neuronal, y está creando una incrustación de ese video, y eso diferencia la escena de otras maneras desde una salida o una caminata ".
Al definir las relaciones entre diferentes clips, el sistema de Netra permite organizar y buscar contenido de nuevas formas. Las empresas de medios pueden determinar momentos emocionantes en eventos deportivos con las emociones de los fanáticos. También se puede agrupar el contenido por tema, ubicación o por si los clips incluyen o no contenido sensible o perturbador.
Esas capacidades tienen importantes implicaciones para la publicidad en línea. Una empresa de publicidad que represente una marca como la empresa de ropa para actividades al aire libre Patagonia, podría utilizar Netra para colocar anuncios al contenido de senderismo. Las empresas de medios podrían ofrecer espacios publicitarios de marcas en torno a clips de personas patrocinadas.
Esas capacidades ayudan a los anunciantes a tener nuevas regulaciones de privacidad a través del mundo y poner restricciones en portales de datos a personas individuales, especialmente niños. Dirigirse a ciertos grupos de personas con sus anuncios a través de la pagina web puede resultar controvertido.
Kant cree que el motor de IA de Netra es un paso para brindar a los consumidores mas control de sus datos, una idea defendida por mucho tiempo por Berners-Lee.
Kant dice “No es la implementación de mi trabajo CSAIL, pero diría que las ideas conceptuales que perseguía en CSAIL se plasman en la solución de Netra”
Transformando la forma en que se almacena la información
Actualmente Netra cuenta con alguna de las empresas más grandes de publicidad y medios del país como clientes. Kant cree que el sistema de Netra podría algún día a ayudar a cualquiera a buscar y organizar el creciente océano de contenido de video en Internet. Con ese fin, el observa que la solución de Netra continua evolucionando.
Kant dice "La búsqueda no ha cambiado mucho desde que se inventó para la web 1.0", “En este momento hay muchas búsquedas basadas en enlaces. Los enlaces son obsoletos en mi opinión. No desea visitar diferentes documentos. Desea que la información de esos documentos se agregue en algo contextual y personalizable, incluida solo la información que necesita ".
Kant cree que la contextualización mejoraría enormemente la forma en que se organiza y se comparte la información en internet.
Kant explica "Se trata de confiar cada vez menos en palabras clave y cada vez más en ejemplos", “Por ejemplo, en este video, si Shashi hace una declaración, ¿es porque es un chiflado o hay algo más? Imagine un sistema que pudiera decir: 'Este otro científico dijo algo similar para validar esa afirmación y este científico respondió de manera similar a esa pregunta'. Para mí, ese tipo de cosas son el futuro de la recuperación de información, y esa es la pasión de mi vida. Por eso vine al MIT. Por eso he pasado una década y media de mi vida luchando en esta batalla de la IA, y eso es lo que seguiré haciendo ".
¿Quieres aplicar soluciones de Machine Learning e Inteligencia Artificial en tu negocio? Déjanos un mensaje y te responderemos ASAP.
Este artículo ha sido elaborado tomando el MIT como fuente