자연언어처리 (NLP)9 (Word2Vec) 1. 개념 자연언어처리(Natural Language Processing)에 있어서 word embeddings 을 생성하기 위한 알고리즘이다. 이름 그대로 풀어보면 Word to Vector 로 단어를 벡터로 변환이다. 컴퓨터영역에서 워드 스트링 그대로 처리하기 보다는 숫자로 표현을 해서 처리를 하면 더욱 효율적이다. 이 숫자로 표현을 Embedding 이라 하고 벡터영역에서 숫자를 배치하면 워드간의 거리와 유사도(similarity)를 측정할 수 있다. 가장 유용하게 씌이는 분야는 검색이다. 검색을 하면 단어 단위로 매칭을 하는 것이 아니라 Embeddings 에 의한 벡터 영역에서의 유사도 거리를 측정하여 유사도가 높은 결과부터 화면에 뿌려준다. 아래는 https://jalammar.github.io/illu.. 2023. 12. 17. 이전 1 2 3 다음