IA significa algo con una especie de inteligencia humana o capaz de resolver una tarea humana, incluso más rápido o más seguro.
Los asistentes vocales son bots, software de respuesta a preguntas, sin inteligencia, que no aprenden ni deciden nada por sí mismos.
Es más, algunos investigadores descubrieron que la Inteligencia Artificial de Google era en realidad un montón de personas humanas escribiendo respuestas. lo que significa que los inversores de mil millones de dólares pagaron por el trabajo humano, no por resolver la Inteligencia Artificial. 🙁
Debo añadir que Siri de SRI está utilizando ontologías de lenguaje natural que hicieron de Siri la representación de conocimiento más inteligente. pero los asistentes vocales siguen siendo idiotas.
Junto con el mejor asistente personal, que viene de Google y se llama son software de asistente personal. Utilizan el reconocimiento de voz o de texto para determinar la pregunta que la persona está haciendo y luego tratan de proporcionar una respuesta adecuada. En segundo plano, utilizan el aprendizaje automático para saber cómo ayudar al usuario. Las respuestas pueden basarse en información de varios sistemas. También permiten acceder a los mensajes y establecer recordatorios y alarmas. Para la mayoría de los asistentes, la mayor parte del procesamiento se realiza en la nube. Siri fue uno de los primeros asistentes personales disponibles y sigue siendo el más débil.
En realidad se trata de dos preguntas no relacionadas, pero bueno, me siento juguetón.
Vamos a quitarnos de encima la más fácil: Siri y Alexa son plataformas de software y no son, en el sentido general, inteligentes. Son muy, muy buenos para transmitir la sensación de que tienen conocimientos e inteligencia, pero no están vivos, ni son sensibles y no aprenden sin la ayuda de sus manejadores humanos. No son capaces de razonar, imaginar, correlacionar o sentir. Son interfaces de usuario en plataformas en la nube que automatizan y asisten en las tareas. Eso es todo.
La IA es la abreviatura de «Inteligencia Artificial» y es la idea de que los humanos pueden diseñar y construir un agente inteligente utilizando materiales no orgánicos, es decir, piedras y chispas, los llamamos ordenadores por la gente que solía hacer todas las sumas y restas en los equipos de contabilidad, pero ahora hemos relegado esa tarea mundana y rutinaria a, bueno, los ordenadores. (suspiro) Pero divago…
La IA significa diferentes cosas para diferentes personas en diferentes contextos. La penúltima definición es la de un agente artificial que alcanza o supera la capacidad humana de inteligencia, que tiene la capacidad de observar, sentir, razonar, imaginar, representar, descubrir y articular como un humano. El punto en el que esto se vuelve confuso es que, para cualquiera de estas cosas, resulta que no es tan difícil engañar al ser humano medio para que piense que otro ser humano debe estar detrás de lo que sea: el deepfake, el asistente de voz, el chatbot, el coche que se conduce solo, son todos excelentes ejemplos de IA compleja, pero limitada por el contexto. Hacen una tarea (groseramente) única, pero pídele a la IA de un coche autoconducido que haga un deepfake y, si tienes suerte, puede que se apague en un soplo de lógica y, si tienes mala suerte, puede que se estrelle en la desesperación. Vale, puede que esté exagerando un poco. La cuestión es que, cuando hablamos de IA, muchas veces estamos hablando realmente de AUTOMATIZACIÓN y esa AUTOMATIZACIÓN, por muy compleja que sea, sigue un conjunto limitado de reglas (a menudo llamadas heurísticas).
Pero las máquinas no piensan realmente, y definitivamente no piensan por sí mismas. Se puede pensar en ellas como marionetas muy sofisticadas. Marionetas que tienen controles muy sofisticados, controles que puedo manipular para que respondan a una variedad de entradas, incluso simultáneas, sin que yo intervenga directamente cada vez. De la misma manera que puedes tocar algunas imágenes en la pantalla de tu teléfono y ver un vídeo o programar una alarma. Alexa es lo mismo, es sólo una interfaz. No importa qué, al final se reduce a una decisión a través de un conjunto de reglas, independientemente de si la derivación de esas reglas fue automatizada o programada manualmente o alguna combinación de ellas.
Entonces, ¿de qué está hablando todo el mundo?
Lo que ha cambiado en los últimos 10 años son 3 grandes cosas (y muchas otras pequeñas cosas, pero estoy tratando de ser breve):
La potencia de procesamiento y la memoria son abundantes y baratas, tanto a nivel local (en el mismo ordenador) como a gran escala (a través de la computación distribuida/en red y la computación en red). Esto nos permite procesar más datos con mayor rapidez que nunca y a mayor escala. Esto lleva a que soluciones que antes eran impracticables se conviertan en métodos factibles, y nos ha permitido recoger y procesar más datos que nunca.
El aprendizaje automático a través de la modelización estocástica y la aplicación de una serie de «técnicas de IA» (como las cadenas de Markov) han conducido al desarrollo de herramientas automatizadas que pueden derivar complejos sistemas de árboles de decisión para que las aplicaciones los utilicen para tomar decisiones en dominios específicos y entrenados. Por ejemplo, puedo entrenar una «IA» para que reconozca una variedad de entradas de audio y las traduzca a texto.
El Procesamiento del Lenguaje Natural ha mejorado notablemente junto con la conversión de voz en texto y de texto en voz. Esto se debe en parte a los números 1 y 2, y en parte a la explosión de Internet, que exige una mejor gestión de contenidos y herramientas de búsqueda, y sobre todo a la demanda de mejores tecnologías de interfaz y búsqueda y sistemas más accesibles.
Hay muchos cerebros grandes involucrados en el desarrollo, las aplicaciones y la investigación de la IA. Hay muchos dominios y metodologías que compiten entre sí. Hay muchas discusiones religiosas en los foros de la red sobre el ML y la simbología. Pero si hablamos de asistentes de voz, de IA y de chatbots, estamos hablando de intercambio de información, de aparición de contenidos, de interfaces conversacionales y de mando y control. Aquí es donde se encuentra el estado del arte, y aunque estos agentes tienen límites duros, lo que están exponiendo es un futuro con más automatización, y más interacciones naturales y mejor accesibilidad.