1. 일단 파싱이 무엇인가
2. Parsing이란,
우리말로 하면 구문분석
문장을 구성하는 단어들이 어떤 구조로 서로 엮여 있나 나타내는 것
크게 Constituency Parsing과 Dependency Parsing으로 나눌 수 있다.
Constituency Parsing는 문장이 명사구, 동사구, 이런것 처럼 구단위로 묶어 나가면서 구조를 이루어 나간다는 개념의 구조이고
Dependency Parsing은 단어와 단어간의 관계를 기본으로 누가 그 단어의 헤드인지 차일드인지-의미적으로 지배하는지 지배 당하는지-를 가지고 관계를 구분 하는 방법
완성된 형태를 트리라고 한다.
3. Constituency Parsing과 Dependency Parsing의 차이점과 특징
4. Dependency Parsing의 2가지 방법
대략 크게 2가지로 볼 수 있다. 하나는 Transition-base 다른건 Graph-base
Transition-base는 단어와 단어를 분석할 때, 두단어 사이의 관계가 헤드인지, 차일드인지, 아니면 판단을 유보할지 처럼 두단어 사이의 관계만을 가지고 전체적인 트리를 만들어 가는 방법
5. Graph-base Parsing
Graph-base파싱 방법은 그 문장에서 가능한 모든 의존관계를 찾아내고, 그 의존관계들의 조합에서 가장 합리적인 트리를 입력 문장의 트리로 결정하는 것
6. 결정 방법
이를 결정하는 방법으로는 여러 트리를 구성하고 있는 각각의 의존관계들의 점수 합이 가장 큰 트리를 가장 합리적인 트리라고 생각하는 것이다.
출처
1. 온라인 학습을 이용한 한국어 의존구문분석
2. Graph Based Dependency Parsing 1
http://www.coli.uni-saarland.de/~yzhang/rapt-ws1112/slides/qiu.pdf
3. Graph-based Dependency Parsing 2
http://clear.colorado.edu/dependency/Dependency-Parsing-Workshop-2009/mcdonald.pdf
[…] 1. Parsing, Dependency Parsing, Graph-based Parsing이 뭔가 […]