Conceptualizacion ocr
De Computacion
PROFESIONAL EN FORMACION: JUAN PABLO ORDOÑEZ LOPEZ
Tarea 1: Glosario de términos.
| | | | | |
| Reconocimiento de caracteres | | | Técnicas utilizadas para la traducción de texto como imagen a texto digital | Concepto |
| Software OCR | | | Es el software que usa las técnicas de OCR para realizar la transformación de imágenes a texto digital | Concepto |
| Lenguajes | | | Tipo de lenguaje natural en el que se reconoce la imagen como texto | Concepto |
| Redes neuronales | | | Son técnicas que simulan las neuronas naturales y su comportamiento | Concepto |
| Sistema operativo | | | Software base | Concepto |
| Linux | | | Sistema operativo | Instancias
Atributos |
| MAC | | | Sistema operativo | Instancias
Atributos |
| Windows | | | Sistema operativo | Instancias
Atributos |
| Digitalización de
textos (escáner) | | | Realiza la transformación de la imagen real a una imagen digital | Concepto |
| Separación de texto
y gráficos | | | Proceso manual mediante el cual el usuario con un software separa gráficos de lo que es texto como imagen | Concepto |
| Aislamiento de texto | | | Consiste en determinar renglones de la imagen de texto y a su ves obtiene las palabras por cada renglón | Concepto |
| Extracción de
características | | | Consiste en generar una matriz que contiene los porcentajes de área ocupada por cada parte de la matriz del carácter | Concepto |
| Reconocimiento | | | Este proceso permite aproximar a través de una red neuronal cual es el carácter que mas se aproxima según las características que contiene la matriz de la imagen | Concepto |
| Texto | | | Es el texto ya digitalizado que se ha generado después de un proceso de reconocimiento | Concepto |
| Detección de
renglones | | | Este proceso se encarga de separar todas las filas de texto en la imagen | Concepto |
| Separación de
caracteres | | | Este proceso se encarga de separar todos los caracteres en una fila de texto como imagen | Concepto |
| Matriz de
características | | | Contiene la representación del carácter como valores de o a 1 | Concepto |
| Entrenamiento | | | Proceso a través del cual la red neuronal es capas de aprender, almacenar y generalizar basada en patrones para futuras clasificaciones de nuevos elementos | Concepto |
| Aprendizaje
Red neuronal backpropagation | | | Es el tipo de algoritmo que utiliza la red neuronal para aprender en base a unos patrones | Concepto |
| entrada | | | Es la capa de entrada de la red neuronal | Concepto |
| salida | | | Es la capa de salida de la red neuronal | Concepto |
| oculta | | | Es la capa oculta de la red neuronal | Concepto |
| bits de la
imagen a reconocer | | | Representan las características de un carácter en particular extraídas desde su imagen | Concepto |
| letra del
alfabeto | | | Representa un carácter cualesquiera del conjunto a reconocer | Concepto |
| subcapa | | | Representa una de la n subcapas que puede tener la capa oculta | Concepto |
| función de
transferencia | | | Es el tipo de función que se utiliza en cada subcapa de la capa oculta para transmitir información a las siguientes subcapas o a la capa de salida | Concepto |
| neuronas | | | Es el elemento mínimo de una red neuronal artificial | Concepto |
| peso | | | Carrera de Electrónica y Telecomunicaciones | Concepto |
| ExperVision
TypeReader & OpenRTK | | | Es un Software OCR | Instancias
Atributos |
| Readiris | | | Es un Software OCR | Instancias
Atributos |
| OmniPage | | | Es un Software OCR | Instancias
Atributos |
| FineReader | | | Es un Software OCR | Instancias
Atributos |
| Ingles | | | Es un Lenguaje | Instancias
Atributos |
| Español | | | Es un Lenguaje | Instancias
Atributos |
| Otros | | | Es cualquier otro lenguaje | Instancias
Atributos |
| monocapa | | | Es un tipo de estructura de red neuronal | Instancias
Atributos |
| multicapa | | | Es un tipo de estructura de red neuronal | Instancias
Atributos |
| a | | | Es una letra del letra del
alfabeto | Instancias
Atributos |
| b | | | Es una letra del letra del
alfabeto | Instancias
Atributos |
| c | | | Es una letra del letra del
alfabeto | Instancias
|
| d | | | Es una letra del letra del
alfabeto | Instancias
Atributos |
| e | | | Es una letra del letra del
alfabeto | Instancias
Atributos |
| f | | | Es una letra del letra del
alfabeto | Instancias
Atributos |
| g | | | Es una letra del letra del
alfabeto | instancias
|
| h | | | Es una letra del letra del
alfabeto | instancias
|
| i | | | Es una letra del letra del
alfabeto | instancias
|
| j | | | Es una letra del letra del
alfabeto | instancias
|
| k | | | Es una letra del letra del
alfabeto | instancias
|
| l | | | Es una letra del letra del
alfabeto | instancias
|
| m | | | Es una letra del letra del
alfabeto | instancias
|
| n | | | Es una letra del letra del
alfabeto | instancias
|
| o | | | Es una letra del letra del
alfabeto | instancias
|
| p | | | Es una letra del letra del
alfabeto | instancias
|
| q | | | Es una letra del letra del
alfabeto | instancias
|
| r | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| s | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| t | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| u | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| v | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| w | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| x | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| y | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| z | | | Es una letra del letra del
alfabeto | instancias
Atributos |
| Corre sobre | | | Nos indica que un determinado software corre sobre cierto sistema operativo | Relación |
| Utiliza | | | Nos indica que un objeto en este caso software utiliza otro objeto llamado redes neuronales | Relación |
| Reconoce | | | Nos indica que un software es capaz de reconocer ciertos lenguajes | Relación |
| Es entrada de | | | Esta relación nos indica que un proceso es necesario que se haya ejecutado para que de lugar a otro. | Relación |
| Proceso posterior a | | | Esta relación nos indica que un proceso se ejecuta después de que se haya ejecutando cualquier otro proceso. | Relación |
| Tiene proceso de | | | Esta relación nos indica que al aplicar la técnica OCR se tiene un numero de procesos finitos a seguir | Relación |
| Se obtiene de | | | Esta relación nos indica que algo se obtiene como resultado de la aplicación de un proceso | Relación |
| Genera | | | Nos indica que dado un proceso lanza un tipo de resultado | Relación |
| Utiliza algoritmo | | | Esta relación nos indica que una red multicapa hace uso del algoritmo de aprendizaje backpropagation | Relación |
| Es utilizada en el | | | Nos indica que un tipo de algoritmo es utilizado en el proceso de aprendizaje | Relación |
| Lo hace a través | | | Nos indica que el proceso de aprendizaje de la red neuronal utiliza un tipo de algoritmo | Relación |
| Tiene una capa | | | Nos indica que una que una red neuronal backpropagation tiene varios tipos de capas | Relación |
| Tiene | | | Nos indica que un objeto tiene otro objeto | Relación |
| Tiene una | | | Nos indica que la capa de salida tiene una capa de salida | Relación |
| Es tomada de | | | Nos indica que en la capa de entrada es tomada la matriz de característica para procesar el reconocimiento | Relación |
Tarea 2. Construir conceptos taxonomías
Tarea 3. Relación de la ontología OCR con otras ontologías.
Tarea 4. Construcción de conceptos de diccionario.
| | | | |
| Reconocimiento de caracteres | --- | --- | Tiene proceso de |
| Software OCR | Software | Versión
Ralease Desarrolladores Plataformas | Utiliza
Reconoce Are |
| Lenguajes | --- | --- | --- |
| Redes neuronales | --- | Estructura
Modelos Topología | --- |
| Sistema operativo | --- | Versión
Año Distribución Licencia | --- |
| Digitalización de
textos (escáner) | --- | --- | Es entrada de |
| Separación de texto
y gráficos | --- | --- | Es entrada de
Proceso posterior a |
| Aislamiento de texto | --- | --- | Es entrada de
Proceso posterior a Tiene proceso de |
| Extracción de
características | --- | --- | Es entrada de
Proceso posterior a Genera |
| Reconocimiento | --- | --- | Proceso posterior a
genera |
| Texto | --- | --- | Se obtiene de |
| Detección de
renglones | --- | --- | Es entrada de |
| Separación de
caracteres | --- | --- | Es entrada de
Proceso posterior a |
| Matriz de
características | --- | --- | Se obtiene de |
| Entrenamiento | --- | --- | Lo hace a través |
| Aprendizaje
Red neuronal backpropagation | --- | Es utilizada en el
Tiene una capa | |
| entrada | Capa red neuronal | --- | Es tomada de |
| salida | Capa red neuronal | --- | Tiene una |
| oculta | Capa red neuronal | --- | Tiene n
Tiene mxn |
| bits de la
imagen a reconocer | --- | --- | genera |
| letra del
alfabeto | Alfabeto | --- | Se obtiene de |
| subcapa | --- | --- | Tiene |
| función de
transferencia | --- | --- | --- |
| neuronas | --- | --- | Tiene |
| peso | --- | --- | --- |
Tarea 5. To define ad hoc binary relations in detail
| Relation
Name | Source
Concept | Source
Card(max) | Target
Concept | Mathematical
Properties | Inverse Relation |
| Corre sobre | Software OCR | N | Sistema Operativo | --- | --- |
| Utiliza | Software OCR | N | Red neuronal | --- | --- |
| Reconoce | Software OCR | N | Lenguajes | --- | --- |
| Es entrada de | Extracción de características | 1 | Reconocimiento | --- | Proceso posterior a |
| Proceso posterior a | Reconocimiento | 1 | Extracción de características | --- | Es entrada de |
| Tiene proceso de | Reconocimiento de caracteres | 1 | Extracción de características | --- | --- |
| Se obtiene de | Texto | 1 | Reconocimiento | --- | Genera |
| Genera | Reconocimiento | 1 | Texto | --- | Se obtiene de |
| Utiliza algoritmo | Multicapa | 1 | Aprendizaje
Red neuronal backpropagation | --- | --- |
| Es utilizada en el | Aprendizaje
Red neuronal backpropagation | 1 | Entrenamiento | --- | Lo hace a través |
| Lo hace a través | Aprendizaje
Red neuronal backpropagation | 1 | Entrenamiento | --- | Es utilizada en el |
| Tiene una capa | Aprendizaje
Red neuronal backpropagation | 1 | input | --- | --- |
| Tiene | Neurona | 1 | peso | Transitive, Symetrical | --- |
| Tiene una | subcapa | 1 | Función de transferencia | --- | --- |
| Es tomada de | input | 1 | Bits de la imagen a reconocer | --- | --- |
Tarea 6. Definición de instancias de atributos en detalle.
| Instance
Attribute name | Concept name | Value
Type | Measurement
Unit | Precision | Range of values | Cardinality | ||
| ExperVision
TypeReader & OpenRTK | Sofware OCR | String | --- | 20 | --- | (1,1) | ||
| Readiris | Sofware OCR | String | --- | 20 | --- | (1,1) | ||
| OmniPage | Sofware OCR | String | --- | 20 | --- | (1,1) | ||
| FineReader | Sofware OCR | String | --- | 20 | --- | (1,1) | ||
| Ingles | Lenguaje | String | --- | 20 | --- | (1,1) | ||
| Español | Lenguaje | String | --- | 20 | --- | (1,1) | ||
| Otros | Lenguaje | String | --- | 20 | --- | (1,1) | ||
| monocapa | Red neuronal | String | --- | 20 | --- | (1,1) | ||
| multicapa | Red neuronal | String | --- | 20 | --- | (1,1) | ||
| a | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| b | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| c | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| d | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| e | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| f | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| g | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| h | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| i | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| j | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| k | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| l | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| m | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| n | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| o | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| p | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| q | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| r | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| s | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| t | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| u | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| v | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| w | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| x | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| y | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| z | letra del
alfabeto | String | --- | 20 | --- | (1,1) | ||
| Linux | Sistema operativo | String | --- | 20 | --- | (1,1) | ||
| MAC | Sistema operativo | String | --- | 20 | --- | (1,1) | ||
| Windows | Sistema operativo | String | --- | 20 | --- | (1,1) | ||
Tarea 7. Definición de atributos de clases en detalle.
| Attribute name | Defined at concept | Value
Type | Measurement
Unit | Precision | Cardinality | Values |
| Versión | Software OCR | String | --- | 20 | (1,1) | --- |
| Ralease | Software OCR | String | --- | 20 | (1,1) | --- |
| Desarrolladores | Software OCR | String | --- | 20 | (N,1) | --- |
| Plataformas | Software OCR | String | --- | 20 | (1,1) | --- |
| Estructura | Redes neuronales | String | --- | 20 | (1,1) | --- |
| Modelos | Redes neuronales | String | --- | 20 | (N,1) | --- |
| Topología | Redes neuronales | String | --- | 20 | (2,1) | --- |
| Versión | Sistema Operativo | Integer | --- | 2 | (1,1) | --- |
| Año | Sistema Operativo | Integer | --- | 5 | (1,1) | --- |
| Distribución | Sistema Operativo | String | --- | 20 | (1,1) | --- |
| Licencia | Sistema Operativo | String | --- | 20 | (1,1) | --- |
Tarea 8. Definición de constantes en detalle.
| Name | Value Type | Value | Measurement
Unit |
| Máximo numero de funciones de transferencia por subcapa en la capa oculta | Integer | 1 | --- |


