Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
Tags
- 전처리
- 너비우선탐색
- 깊이우선탐색
- 건축물대장정보
- NLP
- xmltodict
- 우선순위큐
- dp
- 백준
- 수학
- 비트마스킹
- 코사인유사도
- 지진대피소
- 그래프이론
- 자연어처리
- cosine
- 분할정복
- 그래프탐색
- 공공데이터
- 그리디
- 누적합
- 재귀
- TF-IDF
- pandas
- geopy
- 유사도
- GroupBy
- Geocoding
- 유클리드
- 구현
Archives
- Today
- Total
목록코사인유사도 (1)
정리용

문서의 유사도를 측정하는 방법은 2가지가 대표적이다 하나는 유클리드 거리를 사용하는 방법과 나머지는 코사인 유사도를 사용하는 방법이다. 1. 유클리드 거리 (Euclidean distance) 유클리드 거리는 벡터의 거리를 기준으로 유사도로 측정하는 방법이다 피타고라스 정리를 이용한 빗변의 길이를 구하는 것으로 거리가 가까울수록 유사도가 크다. B- C 의 거리(베타) 가 A-B 의 거리(알파) 보다 크기 때문에 A - B 의 유사도가 더 크다 2. 코사인 유사도 코사인 유사도는 벡터 사이 각도를 기준으로 유사도를 측정하는 방법이다. 벡터의 크기는 배제하고 방향만 보는 것으로 백터 사이각이 좁을수록, 즉 코사인값이 클수록 유사도가 높다. 또한 이때 벡터 사이 각도는 0도~ 90도의 값을 가지게 되는데 이..
딥러닝/이론
2022. 1. 25. 17:57