PyKomoran.type module

class PyKomoran.type.Token(token_in_dict, use_pos_name=False)

Bases: object

Komoran(Java)의 Token Class에 대응합니다. 형태소 분석 결과 저장을 위해 사용합니다.

Parameters:
  • token_in_dict (dict) – Token으로 만들 Dict
  • use_pos_name (bool) –

    Token 출력 시 품사 이름 사용 여부 (기본값: False)

    True 인 경우 품사 기호 대신 품사 이름을 사용합니다.

    False 인 경우 품사 기호를 사용합니다.

Examples

>>> # komoran은 Komoran 객체입니다.
>>> tokens = komoran.get_token_list("① 대한민국은 민주공화국이다.")
>>> token = tokens[1]
>>> token
대한민국/NNP(2,6)
>>> token.get_morph()
'대한민국'
>>> token.get_pos()
'NNP'
>>> token.get_begin_index()
2
>>> token.get_end_index()
6
get_begin_index()

형태소의 시작 인덱스를 반환합니다.

Returns:시작 인덱스
Return type:int
get_end_index()

형태소의 종료 인덱스를 반환합니다.

Returns:종료 인덱스
Return type:int
get_morph()

형태소를 반환합니다.

Returns:형태소
Return type:str
get_pos()

품사를 반환합니다.

Returns:품사 기호 (또는 이름)
Return type:str
class PyKomoran.type.Pair(pair_in_dict)

Bases: object

Komoran(Java)의 Pair Class에 대응합니다. 형태소 분석 결과 저장을 위해 사용합니다.

Parameters:pair_in_dict (dict) – Pair로 만들 Dict

Examples

>>> # komoran은 Komoran 객체입니다.
>>> pairs = komoran.get_list("① 대한민국은 민주공화국이다.")
>>> pair = pairs[1]
>>> pair
대한민국/NNP
>>> pair.get_first()
'대한민국'
>>> pair.get_second()
'NNP'
get_first()

형태소를 반환합니다.

Returns:형태소
Return type:str
get_second()

품사를 반환합니다.

Returns:품사 기호
Return type:str
class PyKomoran.type.Pos

Bases: object

형태소 분석 결과로 나올 수 있는 모든 품사들에 대한 정보를 갖고 있습니다.

전체 품사표는 품사표 (PoS Table) 를 참고해주세요.

Examples

>>> pos_table = Pos()
>>> pos['NNP']
'고유 명사'
>>> pos['SW']
'기타기호(논리수학기호,화폐기호)'
>>> len(pos_table)
45
has_key(key)
items()
keys()
values()