Red Seguridad 84

¿Quién necesita extraer inteligencia de fuentes abiertas (OSINT)? C on el continuo crecimiento de las redes sociales, la cantidad mundial de datos digitales se duplica cada año. Las instituciones y empresas capaces de extraer inteligencia de las fuentes abiertas (OSINT) cuentan con grandes ventajas estratégicas. No en vano, exprimir la montaña de datos no estructurados (desde emails a tweets ) abre innumerables posibilidades para las organizacio- nes: conocer la percepción del públi- co mediante el análisis automatizado de sentimientos, predecir circunstan- cias que podrían afectar a sus ope- raciones actuales y a su crecimiento futuro, investigar nuevos mercados o extraer inteligencia sobre sus com- petidores. Desde el punto de vista policial, realizar minería de big data con des- treza se ha convertido en una dimen- sión esencial del contraterrorismo, la ciberseguridad, la aplicación de políti- cas de drogas, la seguridad fronteriza y la recopilación de información para fines de inteligencia. Además, las fuerzas del orden uti- lizan OSINT al objeto de obtener información predictiva que les permita proteger a los civiles durante manifes- taciones y períodos de inestabilidad social. Para que el análisis sea ope- rativo se requiere cruzar los límites tradicionales de geografía, idioma y cultura. Pero, ¿tiene el organismo policial una manera fiable de confirmar la identidad en las fronteras? ¿Está investigando con precisión los ante- cedentes de personas de interés e instituciones financieras consultando todas las listas de vigilancia mun- diales? ¿Es capaz de identificar una nueva amenaza potencial aunque el sujeto no aparezca en ninguna base de datos existente? Para superar todos estos desafíos existe una solución fundamental: la analítica de texto multilingüe de alta calidad, utilizando capacidades avan- zadas de procesamiento de lenguaje natural. A diferencia de tiempos pasa- dos, cuando la minería web "global" significaba traducir al inglés y anali- zarlo, hoy en día la solución de van- guardia consiste en aplicar análisis lingüístico a los textos estructurados y no estructurados (noticias, reseñas, blogs , tweets y publicaciones), para estar seguro de que cada palabra se entienda en su contexto nativo. Es la única forma de asegurarse de que los resultados no estén distorsionados por errores sutiles debidos a la jerga, la sintaxis o la ortografía. Las herramientas necesarias para extraer inteligencia con éxito de cual- quier fuente de datos ya existen. Para seguir de cerca las amenazas de seguridad, necesita un sistema OSINT que sea capaz de: – Arrojar resultados de alta calidad en todos los idiomas críticos o de "zona de conflicto". – Ofrecer escalabilidad, funcionali- dad y características robustas. – Integrarse fácilmente en su infraes- tructura existente. Además, la solución debe satis- facer tanto los requisitos actuales como las necesidades futuras. Diez preguntas 1. ¿Maneja bien los textos cortos como tweets, SMS y estados de redes sociales? Tradicionalmente, los tweets han sido más difíciles de analizar porque hay menos contexto para trabajar, y con frecuencia incluyen jerga, abrevia- turas y emoticonos. Ahora, muchas soluciones son capaces de un exce- lente análisis de Twitter, identificando el idioma y encontrando menciones de personas, lugares y empresas. 2. ¿El sistema puede analizar con efectividad un texto que incluya jerga y vocabulario especializado? Si su organización utiliza un vocabula- rio específico de su sector, su solución debe tener algoritmos que puedan ser entrenados con el tiempo para lograr una mayor precisión. Por lo tanto, bus- que una solución de analítica de texto que funcione de manera inmediata, pero que también pueda adaptarse para satisfacer las exigencias específi- cas y cambiantes de cualquier sector. 3. ¿Cómo garantizo resultados de alta calidad en todos los idiomas? La bondad de cualquier solución de analítica de textos depende de su base de análisis lingüístico. La traducción automática confunde el significado. Se necesita una solución en la que cada idioma se entienda de forma nativa. Este enfoque lingüístico no relaciona las palabras basándo- se en su apariencia, sino en lo que significa cada palabra dentro de su 48 red seguridad primer trimestre 2019 Steve Cohen COO y cofundador de Basis Technology opinión forense monográfico

RkJQdWJsaXNoZXIy MzA3NDY=