고성능 데이터 처리 기술
빠르고 효율적인 머신러닝 분석 기술
고성능
데이터 처리 기술
빠르고 효율적인
머신러닝 분석 기술

EINSIS는 필터링 샘플링 없이 전체 데이터를 처리하는 고성능 데이터 처리에 대한 원천 기술과 정규표현식 기반의 빠르고 효율적인 머신러닝 원천 기술을 보유하고 있습니다. 기존 머신러닝 기술은 다양한 데이터의 종류와 그 방대한 양을 실시간으로 범용 처리하지 못했기 때문에 제한적으로 머신러닝 기법을 적용하지만, EINSIS는 모든 데이터에 대해서 빅 데이터 분석하므로 머신러닝의 학습 효과를 제대로 발휘할 수 있습니다. 이렇게 처리된 데이터는 범용 언어인 정규표현식으로 분석합니다. 세계에서 가장 앞선 독보적인 정규표현식 고속 검색 기술, 패턴 생성 기술, 상관 관계 분석 기술 등을 다년간 연구하여 상용화하였습니다.

technology_img1 technology_img2
종류에 제한없이 데이터를 이벤트로서 입력받아 분석
• 
타 머신러닝 솔루션의 분석 정보
• 
패킷, 로그 등
• 
AICE의 머신러닝 모듈 분석 정보도 다시 머신러닝 모듈의 입력값으로 활용 가능
• 
다수의 출처에서 데이터를 수집하여 계층(hierarchy)적으로 분석
• 
개별적으로 수집 분석된 정보는 계층 구조 속에서 통합 분석 중앙의 서버에 분석 부하 집중
• 
상관 관계 분석이 동적으로 작동
• 
간단히 정규표현식을 업데이트하여 상관관계 분석을 동적으로 최적화
데이터 수집과 분석이 복수 단계(layer)로 구성
• 
전단계의 분석 결과는 새로운 분석의 정보로 활용됨
• 
기존의 각종 분석 또는 러닝 솔루션을 추가로 분석 가능함
운영 중에 언제라도 새로운 종류의 이벤트를 입력으로 활용 가능
필터링 • 샘플링 없이
원천 데이터 전체 처리

기존 인공지능은 처리 성능의 제약 때문에 머신러닝 전에 사람의 논리(로직)로 고안된 데이터 필터링 또는 샘플링이 필요합니다.
이러한 필터링 및 샘플링은 작업에 시간이 많이 걸리고 지속적으로 업데이트가 어려울 뿐만 아니라 작업한 사람의 편향(bias)이 내재되어 있습니다.
또한 샘플링은 다량의 정상 데이터 속에 소량의 비정상 데이터를 놓치게 되며, 정상 데이터와 비정상 데이터의 차이를 파악하지 못하는 한계를 가지고 있습니다.
AICE는 필터링/샘플링 하지 않고 전체 데이터를 머신러닝으로 분석함으로써, 과거 데이터와 실데이터를 전부 머신러닝으로 분석을 가능하게 하여 머신러닝 알고리즘의 강력함을 제대로 활용할 수 있도록 합니다.

technology_img3
technology_img4
정규표현식으로 표현되는 클러스터
정규표현식으로
표현되는 클러스터

AICE는 분석 결과로 클러스터/아웃라이어 및 이에 대응되는 정규표현식 탐지룰을 생성합니다.
생성된 정규표현식은 클러스터를 나타내며, 클러스터와 이를 나타내는 정규표현식은 후속 데이터와 피드백을 통하여 지속적으로 업데이트 됩니다.
AICE는 클러스터/아웃라이어를 정규표현식 비교 • 분류하므로 어떤 종류의 사전 지식(domain knowledge)이라도 피드백에 활용될 수 있습니다.

technology_img4
모든 데이터 종류를 처리할 수 있고,
원하는 모든 시스템에
손쉽게 공유 가능

AICE는 여러 위치로부터의 다양한 데이터 소스를 손쉽게 분산 처리할 수 있습니다, 또한 기존 결과를 정규표현식으로 인식하므로, 새로운 데이터를 분석할 때 기존 데이터를 반복하여 분석할 필요가 없어서 빠르고 효율적인 머신러닝이 가능합니다.
PCRE와 100% 호환되는 정규표현식을 사용하므로, 결과물인 정규표현식 결과는 타 시스템과 손쉽게 배포 및 공유할 수 있으므로 어떤 비즈니스 도메인에도 이식이 용이합니다.

technology_img5
AICE의 머신러닝 알고리즘

• 패턴 인식 (Pattern recognition)
• 특허 기반의 초고속 계층 클러스터링 (Proprietary, High-speed, • Hierarchical clustering for space reduction)
• 비결정적 유한 오토마타 (Non-deterministic Finite Automata for • automated actions)
• 탐지룰 최적화를 위한 유전 알고리즘 (Genetic algorithm for optimizing • signatures)
• DBSCAN (Density-based spatial clustering of applications with • noise)
• OPTICS (Ordering points to identify the clustering structure)
• KNN (K-nearest neighbors: K-최근접 이웃) for identifying elements in • clusters
• 나이브 베이즈 (Naive Bayes for qualifying clusters)
• 서포트 벡터 머신 (Support Vector Machines for integrated • classification and qualification)
• 시퀀스 마이닝 (Sequence Mining for identifying correlated events)

  • 패턴 인식 (Pattern recognition)
  • 특허 기반의 초고속 계층 클러스터링 (Proprietary, High-speed, Hierarchical clustering for space reduction)
  • 비결정적 유한 오토마타 (Non-deterministic Finite Automata for automated actions)
  • 탐지룰 최적화를 위한 유전 알고리즘 (Genetic algorithm for optimizing signatures)
  • DBSCAN (Density-based spatial clustering of applications with noise)
  • OPTICS (Ordering points to identify the clustering structure)
  • KNN (K-nearest neighbors: K-최근접 이웃) for identifying elements in clusters
  • 나이브 베이즈 (Naive Bayes for qualifying clusters)
  • 서포트 벡터 머신 (Support Vector Machines for integrated classification and qualification)
  • 시퀀스 마이닝 (Sequence Mining for identifying correlated events)
AICE 기술의 우수성
technology_img6
비정형 데이터
클러스터링
DBSCAN 등 공개
비지도학습 알고리즘의 고성능 구현
대용량 데이터 실시간 시계열 클러스터링
정형/비정형
대용량 데이터의
실시간 머신러닝 플랫폼
고성능 정규표현식 매칭
각 클러스터와 동등한 정규표현식 자동 생성
비정형 데이터도 처리
데이터를 스트림 처리하여
고성능 구현
실시간 트렌드 분석
다양한 분야에 적용 가능 (특허 출원)
비결정적 오토마타로 최적화된 고성능 매칭 (특허 등록)
(특허 등록)