- 이메일
- 전화
-
주소
북경시 해전구 교대동로 31호원 D좌 6층
북경천대청원통신과학기술주식유한회사
북경시 해전구 교대동로 31호원 D좌 6층

개요
인터넷의 보급에 따라 중국 네티즌은 3억 3800만 명을 넘어 세계 제1의 네티즌 국가가 되었고, 인터넷의 중요성이 두드러졌으며, 인터넷 여론의 이슈도 속출하고 있다. 상하이시 호적 뉴딜, 산시 신목현 전민 무료 의료......모두 인터넷을 통해 가장 먼저 전파되는 것이다. 인터넷은 이미 정부가 민정을 이해하는 직접적인 경로가 되었고, 새로운 형세 하에서 정부의 중요한 여론 진지이기도 하다.그러므로 인터넷여론이 일단 잘못 통제되고 인도되면 사회안정에 영향을 주는 중대한 우환으로 될것이다.인터넷 여론에 어떻게 대처할 것인가는 현재 우리 나라 각급 정부를 시험하고 있다.
인터넷 여론의 복잡화, 인터넷 언론 공간은2010해가 계속 확대되는데, 특히“마이크로 블로그”의 궐기, 인터넷의제는 전통매체의 호응과 깊이있는 발굴을 받았고 전통매체의 보도도 늘 인터넷에서 신속하게 발효되여 전국적인 여론으로 확대되였다.일부 네티즌들은 온화한 오프라인 행동으로 현실에 개입하기 시작했다.정부는 인터넷 민의에 대한 응답을 가속화하고, 인터넷 제보를 당 규율, 정부 규율, 사법 감독의 새로운 경로로 분류하여 민원을 일으킨 관원의 책임을 추궁한다.이와 동시에 일부 돌발사건에서 대항성이 증가됨에 따라 일부 지방에서는 인터넷정보류동을 제한하는것을 정세를 통제하는 우선선택으로 삼기 쉬우며 다른 일부 지방정부는 대담하게 여론대응과 돌발사건처리의 새로운 메커니즘을 모색하고있다.
다중 데이터 소스 수집 융합 문제, 현재 뉴스, 포럼, 블로그, 마이크로블로그, 동영상 사이트 등 다양한 여론 정보 전파 경로, 같은 여론 정보는 서로 다른 전파 경로에 흩어질 수 있어 데이터 모니터링 시스템이 서로 다른 출처 데이터에 대한 처리가 일치하지 않고 표준이 통일되지 않는 문제를 초래했다. 감독관리의 효율을 확보하기 위해 감독관리 시스템의 메타 정보에 대해 데이터 표준화와 데이터 통합을 실시하여 통일된 인터넷 여론 정보 기초 데이터베이스를 형성해야 한다.
다차원 모니터링 문제, 여론 모니터링은 다차원 데이터 소스에 대해 다차원 분석을 진행하고, 서로 다른 사용자의 수요에 따라 서로 다른 차원의 분석과 표현을 진행할 것을 요구한다.
분석 결과의 관련성과 융합 문제에 대해 기존의 모니터링 시스템이 여론 정보 전파에 대한 분석 기능의 실현은 비교적 적다. 간단한 여론 정보 텍스트 내용 분석만 있을 뿐이다. 따라서 다양한 전파 채널인 뉴스, 포럼, 블로그, 마이크로블로그의 전파 방식과 관련 정보에 대한 종합 분석은 아직 해당하는 시스템과 기술이 없기 때문에 분석 관련 능력이 부족하고 잠재적인 이슈에 대한 발견 능력이 부족하기 때문에 효과적인 해결 방안이 필요하다.
대량의 데이터 처리 문제, 인터넷 데이터 수억, 매일 발생TB이상의 규모의 데이터, 어떻게 대량의 데이터를 저장하고, 어떻게 대량의 데이터를 적시에 효과적으로 처리하며, 어떻게 시스템의 구조를 데이터 규모가 커짐에 따라 자동으로 확장할 수 있는지는 모두 대량의 데이터 처리가 직면한 도전적인 문제이다.
시스템 특징
첫째, 채집 유연성, 웹 탐색기는 세계 최고의 웹 분석 도구로서 웹 페이지의 시각적 특징에 따라 웹 페이지의 임의의 부분의 소스 구조, 노드 구조, CSS 특성을 정확하게 포지셔닝하고 분석할 수 있다;모든 복잡한 페이지 레이아웃을 유연하게 처리하고 수십 가지 데이터 처리 방식을 내장하여 임의의 반구조화된 데이터에서 구조화된 데이터를 쉽게 추출할 수 있습니다.
둘째, 채집 시효성, 분산 검색, 메타 검색, 수직 검색은 서로 보충한다. 검색 엔진은 분산, 병렬 부하 균형 기술을 사용한다. 서버에 운행 부하 불균형 상태가 나타나면 시스템은 사전에 설정한 조절 메커니즘에 따라 서버와 네트워크 설비의 부하를 자동으로 조절할 수 있다. 기존 자원을 충분히 이용하여 시스템의 안정적인 운행을 확보하고 운행 효율을 높여 우리의 빠른 검색 데이터 수집 목표에 도달할 수 있다.
셋째, 사용자 정의성, 즉 사용자의 사용자 정의 수요에 따라 중점 대상, 화제에 대해 초점 모니터링을 진행할 수 있다;
넷째, 지속성, 즉 이미 알고 있는 화제의 후속 각종 인터넷 매체 관련 보도, 전재, 평론 수를 추적하여 그 발전 범위, 동태, 추세를 파악할 수 있다;
다섯째, 전면성으로 서로 다른 기술 형태에 대해 구축된 시스템 데이터에 대해 통합, 분석 처리를 진행하여 관할 범위 내의 데이터의 전면성을 확보한다.