제목 | N_GRAM 네트워크 그래프 | ||
---|---|---|---|
작성자 | 이재문 | 작성일 | 2016-07-24 23:01:55 |
첨부파일 | |||
N_GRAM 네트워크 그래프는 어떤걸 보는 건가요? 단어끼리의 연결관계도를 보는건가요? UciNet과는 다른점이 뭔가요? |
- 다음글
- 이전글
댓글 [1] | ||
---|---|---|
더아이엠씨 |
N-gram 이란 간단히 말하면, 정해진 N의 길이 단위로 문장을 잘라, 단어를 인덱싱하는 방식입니다. 예를 들어 "일관처리 텍스톰"을 2-gram으로 표현하면 "일관, 관처, 처리, 리 , 텍, 텍스, 스톰"으로 표현됩니다. 추가) 텍스톰의 N-gram 경우 단어 단위로 잘라 처리되고 있습니다. 이에 따라 "일관처리","텍스톰"으로 표현됩니다. N-gram 그래프의 경우 N-gram으로 나눠진 문자열이 두 단어가 등장할 경우, 그 양를 값으로 하여 단어간 동시출현 네트워크를 그려지는 방식입니다. 따라서 매트릭스 파일을 활용한 네트워크 지도와는 다소 차이가 납니다. ucinet은 네트워크 분석툴로 매트릭스, 혹은 엣지리스트 형태의 자료를 분석 및 시각화해주는 툴입니다. 2016-07-25 |