워드 토큰화
영문 pip intall nltk import nltk from nltk import word_tokenize from nltk.tag import pos_tag nltk.download('punkt') text = "I am a boy" word_list =word_tokenize(text) print(word_list) pos_tag(word_list) ['I', 'am', 'a', 'boy'] [('I', 'PRP'), ('am', 'VBP'), ('a', 'DT'), ('boy', 'NN')] ◈ VBP : 동사 RB : 부사 VBG: 현재부사 IN : 전치사 NN : 명사 NNP: 고유 명사 NNS: 복수형 명사 CC : 접속사 DT : 관사 한글 pip install konlpy from ko..
2024. 3. 13.