Conceptualizacion ocr

De Computacion

CONCEPTUALIZACIÓN OCR

PROFESIONAL EN FORMACION: JUAN PABLO ORDOÑEZ LOPEZ

Tarea 1: Glosario de términos.


Name
Synonyms
Acronyms
Description
Type
Reconocimiento de caracteres
Reconocimiento óptico de caracteres
OCR
Técnicas utilizadas para la traducción de texto como imagen a texto digital Concepto
Software OCR
Programas OCR
---
Es el software que usa las técnicas de OCR para realizar la transformación de imágenes a texto digital Concepto
Lenguajes
Idiomas
---
Tipo de lenguaje natural en el que se reconoce la imagen como texto Concepto
Redes neuronales
Redes neuronales artificiales
RN
Son técnicas que simulan las neuronas naturales y su comportamiento Concepto
Sistema operativo
---
OS
Software base Concepto
Linux
UNIX
UNIX
Sistema operativo Instancias

Atributos

MAC
Apple
UNIX
Sistema operativo Instancias

Atributos

Windows
Microsoft Windows
WINDOSW
Sistema operativo Instancias

Atributos

Digitalización de

textos (escáner)

Escanear
---
Realiza la transformación de la imagen real a una imagen digital Concepto
Separación de texto

y gráficos

Selección de la imagen de texto
---
Proceso manual mediante el cual el usuario con un software separa gráficos de lo que es texto como imagen Concepto
Aislamiento de texto
Búsqueda de palabras en la imagen de texto
---
Consiste en determinar renglones de la imagen de texto y a su ves obtiene las palabras por cada renglón Concepto
Extracción de

características

Características del carácter como imagen
---
Consiste en generar una matriz que contiene los porcentajes de área ocupada por cada parte de la matriz del carácter   Concepto
Reconocimiento
Reconocer
---
Este proceso permite aproximar a través de una red neuronal cual es el carácter que mas se aproxima según las características que contiene la matriz de la imagen Concepto
Texto
Conjunto de caracteres
---
Es el texto ya digitalizado que se ha generado después de un proceso de reconocimiento Concepto
Detección de

renglones

Encontrar filas de texto
---
Este proceso se encarga de separar todas las filas de texto en la imagen Concepto
Separación de

caracteres

Encontrar caracteres
---
Este proceso se encarga de separar todos los caracteres en una fila de texto como imagen Concepto
Matriz de

características

Características
---
Contiene la representación del carácter como valores de o a 1 Concepto
Entrenamiento
Aprendizaje
---
Proceso a través del cual la red neuronal es capas de aprender, almacenar y generalizar basada en patrones para futuras clasificaciones de nuevos elementos Concepto
Aprendizaje

Red neuronal

backpropagation

Algoritmo de retro propagación
---
 Es el tipo de algoritmo que utiliza la red neuronal para aprender en base a unos patrones Concepto
 entrada
input
---
Es la capa de entrada de la red neuronal Concepto
salida
output
---
Es la capa de salida de la red neuronal Concepto
oculta
hide
---
Es la capa oculta de la red neuronal Concepto
bits de la

imagen a

reconocer

Matriz de vector de características
---
Representan las características de un carácter en particular extraídas desde su imagen Concepto
letra del

alfabeto

Carácter en digital
---
Representa un carácter cualesquiera del conjunto a reconocer Concepto
subcapa
sublayer
---
Representa una de la n subcapas que puede tener la capa oculta Concepto
función de

transferencia

---
FT
Es el tipo de función que se utiliza en cada subcapa de la capa oculta para transmitir información a las siguientes subcapas o a la capa de salida  Concepto
neuronas
nodo
---
Es el elemento mínimo de una red neuronal artificial Concepto
peso
energía
w
Carrera de Electrónica y Telecomunicaciones Concepto
ExperVision

 TypeReader

& OpenRTK

---
---
Es un Software OCR Instancias

Atributos

Readiris
---
---
Es un Software OCR Instancias

Atributos

OmniPage
---
---
Es un Software OCR Instancias

Atributos

FineReader
---
---
Es un Software OCR Instancias

Atributos

Ingles
---
---
Es un Lenguaje Instancias

Atributos

Español
Castellano
---
Es un Lenguaje Instancias

Atributos

Otros
---
---
Es cualquier otro lenguaje Instancias

Atributos

monocapa
---
---
Es un tipo de estructura de red neuronal Instancias

Atributos

multicapa
---
---
Es un tipo de estructura de red neuronal Instancias

Atributos

a
---
---
Es una letra del letra del

alfabeto

Instancias

Atributos

b
---
---
Es una letra del letra del

alfabeto

Instancias

Atributos

c
---
---
Es una letra del letra del

alfabeto

Instancias
Atributos
d
---
---
Es una letra del letra del

alfabeto

Instancias

Atributos

e
---
---
Es una letra del letra del

alfabeto

Instancias

Atributos

f
---
---
Es una letra del letra del

alfabeto

Instancias

Atributos

g
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
h
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
i
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
j
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
k
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
l
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
m
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
n
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
o
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
p
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
q
---
---
Es una letra del letra del

alfabeto

instancias
Atributos
r
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

s
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

t
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

u
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

v
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

w
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

x
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

y
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

z
---
---
Es una letra del letra del

alfabeto

instancias

Atributos

Corre sobre
---
---
Nos indica que un determinado software corre sobre cierto sistema operativo Relación
Utiliza
---
---
Nos indica que un objeto en este caso software utiliza otro objeto llamado redes neuronales Relación
Reconoce
---
---
Nos indica que un software es capaz de reconocer ciertos lenguajes Relación
Es entrada de
---
---
Esta relación nos indica que un proceso es necesario que se haya ejecutado para que de lugar a otro. Relación
Proceso posterior a
---
---
Esta relación nos indica que un proceso se ejecuta después de que se haya ejecutando cualquier otro proceso. Relación
Tiene proceso de
---
---
Esta relación nos indica que al aplicar la técnica OCR se tiene un numero de procesos finitos a seguir Relación
Se obtiene de
---
---
Esta relación nos indica que algo se obtiene como resultado de la aplicación de un proceso Relación
Genera
---
---
Nos indica que dado un proceso lanza un tipo de resultado Relación
Utiliza algoritmo
---
---
Esta relación nos indica que una red multicapa hace uso del algoritmo de aprendizaje backpropagation Relación
Es utilizada en el
---
---
Nos indica que un tipo de algoritmo es utilizado en el proceso de aprendizaje Relación
Lo hace a través
---
---
Nos indica que el proceso de aprendizaje de la red neuronal utiliza un tipo de algoritmo Relación
Tiene una capa
---
---
Nos indica que una que una red neuronal backpropagation tiene varios tipos de capas Relación
Tiene
---
---
Nos indica que un objeto tiene otro objeto Relación
Tiene una
---
---
Nos indica que la capa de salida tiene una capa de salida Relación
Es tomada de
---
---
Nos indica que en la capa de entrada es tomada la matriz de característica para procesar el reconocimiento Relación

 

Tarea 2. Construir conceptos  taxonomías

Imagen:ontologia1.jpg


Tarea 3. Relación de la ontología OCR con otras ontologías.

Imagen:relacionontologias.jpg


Tarea 4. Construcción de conceptos de diccionario.


Concept Name
Class attributes
Instance attributes
Relations
Reconocimiento de caracteres --- --- Tiene proceso de
Software OCR Software Versión

Ralease

Desarrolladores

Plataformas

Utiliza

Reconoce

Are

Lenguajes --- --- ---
Redes neuronales --- Estructura

Modelos

Topología

---
Sistema operativo --- Versión

Año

Distribución

Licencia

---
Digitalización de

textos (escáner)

--- --- Es entrada de
Separación de texto

y gráficos

--- --- Es entrada de

Proceso posterior a

Aislamiento de texto --- --- Es entrada de

Proceso posterior a

Tiene proceso de

Extracción de

características

--- --- Es entrada de

Proceso posterior a

Genera

Reconocimiento --- --- Proceso posterior a

genera

Texto --- --- Se obtiene de
Detección de

renglones

--- --- Es entrada de
Separación de

caracteres

--- --- Es entrada de

Proceso posterior a

Matriz de

características

--- --- Se obtiene de
Entrenamiento --- --- Lo hace a través
Aprendizaje

Red neuronal

backpropagation

---   Es utilizada en el

Tiene una capa

 entrada Capa red neuronal --- Es tomada de
salida Capa red neuronal --- Tiene una
oculta Capa red neuronal --- Tiene n

Tiene mxn

bits de la

imagen a

reconocer

--- --- genera
letra del

alfabeto

Alfabeto --- Se obtiene de
subcapa --- --- Tiene
función de

transferencia

--- --- ---
neuronas --- --- Tiene
peso --- --- ---

 

Tarea 5. To define ad hoc binary  relations in detail


Relation

Name

Source

Concept

Source

Card(max)

Target

Concept

Mathematical

Properties

Inverse Relation
Corre sobre Software OCR N Sistema Operativo --- ---
Utiliza Software OCR N Red neuronal --- ---
Reconoce Software OCR N Lenguajes --- ---
Es entrada de Extracción de características 1 Reconocimiento --- Proceso posterior a
Proceso posterior a Reconocimiento 1 Extracción de características --- Es entrada de
Tiene proceso de Reconocimiento de caracteres 1 Extracción de características --- ---
Se obtiene de Texto 1 Reconocimiento --- Genera
Genera Reconocimiento 1 Texto --- Se obtiene de
Utiliza algoritmo Multicapa 1 Aprendizaje

Red neuronal

backpropagation

--- ---
Es utilizada en el Aprendizaje

Red neuronal

backpropagation

1 Entrenamiento --- Lo hace a través
Lo hace a través Aprendizaje

Red neuronal

backpropagation

1 Entrenamiento --- Es utilizada en el
Tiene una capa Aprendizaje

Red neuronal

backpropagation

1 input --- ---
Tiene Neurona 1 peso Transitive, Symetrical ---
Tiene una subcapa 1 Función de transferencia --- ---
Es tomada de input 1 Bits de la imagen a reconocer --- ---

 

Tarea 6. Definición de instancias de atributos en detalle.


Instance

Attribute name

Concept name Value

Type

Measurement

Unit

Precision Range of values Cardinality
ExperVision

 TypeReader

& OpenRTK

Sofware OCR String --- 20 --- (1,1)  
Readiris Sofware OCR String --- 20 --- (1,1)  
OmniPage Sofware OCR String --- 20 --- (1,1)  
FineReader Sofware OCR String --- 20 --- (1,1)  
Ingles Lenguaje String --- 20 --- (1,1)  
Español Lenguaje String --- 20 --- (1,1)  
Otros Lenguaje String --- 20 --- (1,1)  
monocapa Red neuronal String --- 20 --- (1,1)  
multicapa Red neuronal String --- 20 --- (1,1)  
a letra del

alfabeto

String --- 20 --- (1,1)  
b letra del

alfabeto

String --- 20 --- (1,1)  
c letra del

alfabeto

String --- 20 --- (1,1)  
d letra del

alfabeto

String --- 20 --- (1,1)  
e letra del

alfabeto

String --- 20 --- (1,1)  
f letra del

alfabeto

String --- 20 --- (1,1)  
g letra del

alfabeto

String --- 20 --- (1,1)  
h letra del

alfabeto

String --- 20 --- (1,1)  
i letra del

alfabeto

String --- 20 --- (1,1)  
j letra del

alfabeto

String --- 20 --- (1,1)  
k letra del

alfabeto

String --- 20 --- (1,1)  
l letra del

alfabeto

String --- 20 --- (1,1)  
m letra del

alfabeto

String --- 20 --- (1,1)  
n letra del

alfabeto

String --- 20 --- (1,1)  
o letra del

alfabeto

String --- 20 --- (1,1)  
p letra del

alfabeto

String --- 20 --- (1,1)  
q letra del

alfabeto

String --- 20 --- (1,1)  
r letra del

alfabeto

String --- 20 --- (1,1)  
s letra del

alfabeto

String --- 20 --- (1,1)  
t letra del

alfabeto

String --- 20 --- (1,1)  
u letra del

alfabeto

String --- 20 --- (1,1)  
v letra del

alfabeto

String --- 20 --- (1,1)  
w letra del

alfabeto

String --- 20 --- (1,1)  
x letra del

alfabeto

String --- 20 --- (1,1)  
y letra del

alfabeto

String --- 20 --- (1,1)  
z letra del

alfabeto

String --- 20 --- (1,1)  
Linux Sistema operativo String --- 20 --- (1,1)  
MAC Sistema operativo String --- 20 --- (1,1)  
Windows Sistema operativo String --- 20 --- (1,1)  

 

Tarea 7. Definición de atributos de clases en detalle.


Attribute name Defined at concept Value

Type

Measurement

Unit

Precision Cardinality Values
Versión Software OCR String --- 20 (1,1) ---
Ralease Software OCR String --- 20 (1,1) ---
Desarrolladores Software OCR String --- 20 (N,1) ---
Plataformas Software OCR String --- 20 (1,1) ---
Estructura Redes neuronales String --- 20 (1,1) ---
Modelos Redes neuronales String --- 20 (N,1) ---
Topología Redes neuronales String --- 20 (2,1) ---
Versión Sistema Operativo Integer --- 2 (1,1) ---
Año Sistema Operativo Integer --- 5 (1,1) ---
Distribución Sistema Operativo String --- 20 (1,1) ---
Licencia Sistema Operativo String --- 20 (1,1) ---

 

Tarea 8. Definición de constantes en detalle.


Name Value Type Value Measurement

Unit

Máximo numero de funciones de transferencia por subcapa en la capa oculta Integer 1 ---

 

 

 

 

 
Herramientas personales
Sitios UTPL