De la necesidad de ontologías

8326 lecturas

Hace algunos meses escribí un par de artículos relacionados con la Web Semántica. En realidad, existen una multitud de aspectos relacionados que podría detallar, pero hoy me quiero enfocar en uno: La necesidad de ontologías.

Quizás lo más urgente sería definir qué es una ontología. Según Wikipedia:

El término ontología en informática hace referencia al intento de formular un exhaustivo y riguroso esquema conceptual dentro de un dominio dado, con la finalidad de facilitar la comunicación y la compartición de la información entre diferentes sistemas.

¿Qué significa esto?

En resumen, es un modelo de una parte de la realidad que nos interesa caracterizar formalmente. Es una forma de decirle al computador de que existen ciertos conceptos (clases) que estan relacionados (tienen propiedades) de alguna forma. Por ejemplo, una entidad que llamaremos "estudiante" es una subclase de otra clase llamada "ser humano". Asimismo, un "ser humano" tiene ciertas propiedades que pueden ser únicas, tales como la fecha de nacimiento, múltiples como los hijos que tenga, etc.

¿Y para que sirve esto?

En la medida que los computadores "entiendan" formalmente el mundo, serán capaces de comunicarse y realizar búsquedas complejas dado que "saben" qué están buscando (alguna clase o propiedad) más que simplemente hacer un matching de palabras. Es así como será posible consultar en la web acerca de todos los jugadores de futbol que vistan la camiseta 11 en un club de futbol que tenga un estadio con capacidad para más de 40 mil personas y que sea de un pais de más de 10 millones de habitantes*.

(*) Para entender la complejidad de esta búsqueda, intenten realizarla a mano usando Google :-)

Ok, y de donde saco una ontología?

En principio uno podría comenzar creando su propia ontología desde cero. Sin embargo, hay una fuente de conocimiento que puede ser utilizada y que ha sido desarrollada durante decenios: Los esquemas de base de datos. En estos tenemos una serie de clases (tablas), propiedades (campos), relaciones (llaves primarias, foráneas, triggers), tipos (int, varchar, etc.). En resumen, aunque nunca me ha tocado ver un traductor automático desde un esquema a una ontología, sospecho que debe ser más o menos directo.

Existen una serie de complicaciones relacionadas con las ontologías, por ejemplo, eventualmente se podrían crear ontologías que no son decidibles por un computador (es decir, un computador como lo conocemos, nunca va a ser capaz de "entender", independiente de la velocidad, ram, etc.). Además existen una seria de problemas "mundanos". Por ejemplo ¿Cómo saber si 2 ontologías son equivalentes?, ¿Existe una ontología que que me sirve y que alguien más hizo? Si es así ¿Cómo la encuentro?

De todas formas, para quienes deseen echarle una mirada, ya existen ontologías que abarcan grande áreas del conocimiento humano, tales como FOAF, Gene Ontology y Dublin Core entre muchos otros.

AdjuntoTamaño
owl_logo.gif1.92 KB
Foto de Alvaro

— PhD en Ciencias Cognitivas e Investigador en temas de Open Data, Visualizaciones, Web Semántica, eScience y Web Science. Ingeniero civil en computación. Más información »

7 Comentarios

LED Auto Lampes

If there's a sales star of the Lincoln lineup, it's the MKX. Ford's luxury arm has managed to move over 100,000 of the leather-lined crossovers since 2006, and that pace doesn't look to be slowing anytime soon. Lincoln says the crossover market here in the U.S. is bound to swell considerably in the coming years, Scania Volvo Diagnostic Tools and since it already represents nearly four percent of the automotive industry as a whole, everyone seems to know that this is no place to cut corners. Fortunately, the MKX is set to enjoy its second refresh since hitting the market four years ago.

Given the vehicle's significance, it should come as no surprise that Lincoln is using the 2011 MKX as a springboard for its vision of the company's future. The refreshed MKX benefits from a raft of updates that include many of the changes we saw hit the crossover's Blue Oval clone, the 2011 Ford Edge. With more power,Cables et Prises OBD2 a quieter cabin and an interior that's finally becoming of a true luxury brand, the MKX has the makings of a sales winner. We're just not sure the Lincoln high-rider is far enough away from its kissing-cousin.

Outside, Lincoln has walked away from the semi-retro front fascia of last year's model in favor of the swept corporate nose of the MKT. While we typically despise communal fascia design, the baleen grille does wonders for the nose of the MKX, and helps to further separate the crossover from the Edge. The ample chrome up front gives the CUV a proud face that fits well with the upwardly-mobile Lincoln brand, Programmateur pour Digimaster 3 and that theme is carried on throughout the rest of the exterior. Like the MKZ Hybrid, the new MKX wears more than a few chrome accents. While we have no problem with the shiny stuff on the front fascia, we'd just as soon skip it along the window sills and the door handles.

Ontologías como Convenciones pactadas por humanos

Me tocó conocer una tecnología holandesa, denominada COLLEXIS representada en Chile por nuestros amigos de Octondegus y que está siendo usada para encontrar similitudes entre documentos.

La magia está en el reconocimiento de los conceptos de un documento y luego darse cuenta cuales conceptos aparecen en distintos documentos.

Así, el caso que planteas:
"los jugadores de futbol que vistan la camiseta 11 en un club de futbol que tenga un estadio con capacidad para más de 40 mil personas y que sea de un pais de más de 10 millones de habitantes*"

Se deconstruye como:

Jugadores de Fútbol
vestir
Camiseta 11
Club de Fútbol
tener
Estadio
Capacidad más de 40 mil personas
País de más de 10 millones de habitantes

Luego se opera en base a un diccionario de conceptos para encontrar aquellos que documentos que "hablan de cosas similares".

Este planteamiento materializa una explicación científica antigua, que parte de la base de que el significado no está en las palabras sino que surge de la experiencia de haber aprendido la convención por parte del observador, esto fue propuesto por Maturana hacia 1970 y hasta ahora se incomprende (o no se quiere aceptar).

Nosotros en Newtenberg desarrollamos un concepto equivalente al de Collexis detrás de la noción de Clasificando, este año esperamos materializar un trabajo conjunto con Collexis para entrar en esta área.

Pueden mirar la puesta en escena de este servicio en el área de la Salud y encontrar por ejemplo, un paper que incluso hable en otro idioma sobre "Enfermedades parasitarias como la malaria".

http://www.sharingpoint.net/

Saludos
Pepe Flores
jflores at ntg.cl

Complementarios

A mi me parece que aunque ambas posturas quieran venderse como la solucion inteligente, son absolutamente complementarias, dado el actual estado de cosas.

Durante muchos años el conocimiento se ha escrito los formatos electronicos mas variados, y los esfuerzos de sistematizar y organizar el conocimiento universal han sido relativamente exitosos (caso de Wikipedia), por otra parte hay que reconocer los grandes avances en los motores de busqueda...alguien recuerda sus trucos de busqueda en la web antes de Google? Cambiar el orden de las palabras, usar comillas a veces si y a veces no, etc.

Un sistema de organizacion de conocimiento basado en ontologias no sera util sin un data minning que busque y clasifique la informacion, como ningun motor de busqueda sera eficiente sin un sistema interno que almacene la informacion basandose en algun sistema ontologico.

Ahora, desde el punto de vista un poco mas filosofico, creo que la mente funciona usando ambos esquemas, en las primeras etapas de aprendizaje buscamos empapar de conocimiento, conceptos e ideas sin intentar organizarlas, un niño de 2 años tiene alguna idea de como comunicarse, aunque falle en la conjugacion de verbos e invente sustantivos...en etapas mas avanzadas de conocimiento, intentamos clasificar, hacer resumen y analogias con conceptos similares, como una forma de ordenar la informacion para su posterior recuperacion.

No me parece que sean esquemas separados, mas bien me parecen intimamente complementarios. Saludos a todos.

Prometeo

Una carrera

Yo veo esto como una carrera entre dos "bandos".

Por un lado está la gente de recuperación de información, que piensa que los sistemas de búsqueda evolucionarán suficientemente rápido, y llegarán a ser capaces de responder por sí solos preguntas avanzadas, sin necesidad de que la información esté etiquetada previamente.

Por otro lado está la gente de la web semántica, que considera que la gente adoptará estándares de marcado para sus datos que hará posible responder preguntas avanzadas como la que planteas. Y decidir algunas ontologías y operaciones sobre ellas es clave para que eso funcione.

Yo creo que al final van a suceder ambas cosas parcialmente. En ciertos dominios la información estará marcada muy bien y se podrá hacer razonamiento, inferencia, etc. automatizada; en otro dominios será por mucho tiempo análisis de texto lo que primará. Es muy difícil predecir esto porque todo está cambiando muy rápido: la capacidad de procesamiento de los buscadores mejora rápidamente, pero también la cantidad de información está creciendo aceleradamente.

ChaTo
Ecosofia.org

ChaTo

IR v/s SW

Cierto, tanto IR como SW apuntan básicamente al mismo objetivo y es probable que se llegue a un punto intermedio. Un alcance: aunque aparentemente es más costoso para la gente en términos de tiempo el uso de tecnologías semánticas, ya hay mucho trabajo hecho, si se aprovecha el esfuerzo realizado para crear buenas bases de datos y modelos de distintas areas.

Alvaro Graves - agraves [at] dcc punto uchile punto cl
MSN: no_mas_zpam [@]correocaliente punto com
Seconds Out, Genesis Tribute


agraves

bibliografía sobre bases de datos

Hola,

Es medio off-topic la pregunta pero me pican las teclas, ¿conoces una buena referencia bibliográfica respecto a bases de datos? estoy buscando una de tipo relacional para un proyecto relacionados con museos (no de programación sino que más bien la estructura conceptual detras). googleando por ahi no he encontrado textos interesantes, de manera que si me pudieras guiar hacia donde encuentre información al respecto estaría muy agradecido.

saludos

Arsenio.

Tejedores del Web

Hay un curso de bases de datos en Tejedores del Web

ChaTo
Ecosofia.org

ChaTo