Replicación de datos para Hadoop
Hadoop es un sistema de código abierto utilizado para almacenar, procesar y analizar grandes volúmenes de datos. Syniti Data Replication (Anteriormente DBMoto) permite replicar datos desde bases de datos relacionales, manteniendo actualizado el sistema de archivos Hadoop HDFS.
Big Data es una de los términos de moda en este momento. La mejor definición es pensar en las tres V, Big Data no solo es volumen, también es velocidad y variedad.
Una arquitectura de Big Data contiene varias partes. Comúnmente, los datos históricos estructurados y semi-estructurados se encuentran almacenados en Hadoop (Volumen + Variedad). Por otro lado, el procesamiento de datos en tiempo real es utilizado para requerimientos de datos veloces (Velocidad + Variedad).
Es por escenarios como el anterior donde soluciones como Syniti Data Replication pueden ayudar en el proceso de optimizar la velocidad de acceso a datos actualizados, a través de sus funcionalidades de integración de datos en tiempo real.
También puede ayudar con la Variedad, ya que Syniti Data Replication soporta una gran variedad de tipos o formatos de datos (XML, imágenes, BLOB, etc.) almacenados en múltiples bases de datos, como SQL Server, Oracle, Sybase, DB2, Informix, MySQL, SQL Anywhere, etc., no importando el sistema operativo donde se encuentren alojadas las bases de datos.
Principales Características
Replicación de datos desde cualquier base de datos relacional a Hadoop HDFS
- Comunicación segura a través de DDH Channel
- Utilice la tecnología estable de Hadoop
- Trabaja con todas las versiones de Hadoop
- Permite a Hadoop administrar la distribución de datos
- Solución flexible y configurable
Use el Management Center para:
- Crear conexiones de origen a tablas RDBMS
- Crear archivos CSV de destino para tablas RDBMS
- Mapear orígenes RDBMS para archivos de destino
- Habilitar replicaciones
Configure y ejecute Syniti DR HBroker para:
- Leer archivos de datos
- Abrir SSH channel
- Truncar tablas existente en caso de ser necesario
- Envíe datos a HDFS