Why we need GraphRAG: Traditional RAG vs. GraphRAG
·
Study/NLP
Background: Traditional RAG SystemKnowledge Organization: Preparing Metadata.일반적인 전략: Text Chunking방대한 텍스트 코퍼스(corpus)를 관리하기 쉬운 '청크(chunks)'라는 작은 단위로 분할.이 청크들은 임베딩(embedding) 모델을 사용하여 벡터(vector) 표현으로 변환됩니다.이렇게 생성된 임베딩은 벡터 데이터베이스(vector database)에서 원본 텍스트 청크의 '키(key)' 역할을 합니다.Semantic Chunking: 시맨틱 공간(semantic space)에서의 거리 기반 검색(distance-based search)을 통한 효율적인 정보 조회 및 검색이 가능해집니다.지식 구성 최적화: 검색 전 단..
언어적 특성 , 언어간의 유사성이란 ??? by GPT
·
Study/NLP
언어 간의 유사성은 다양한 요인에 의해 결정되며, 이는 언어학적, 역사적, 문화적인 측면에서 영향을 받습니다. 일반적으로, 언어 간의 유사성이 적을수록 서로 다른 언어로 간주됩니다. 여러 언어 중에서 영어와 언어적 유사성이 적은 몇 가지 예를 보자. 1. 중국어 (Mandarin) 영어와 중국어는 언어 계열이나 문법, 발음 등에서 큰 차이가 있습니다. 중국어는 톤을 사용하는데, 이는 발음의 높낮이와 어조의 차이로 의미가 달라질 수 있는 특징을 가지고 있습니다. 2. 아라비아어 아랍어와 영어는 언어 계열이 다르며, 알파벳, 문법, 어휘 등에서 상당한 차이가 있습니다. 아랍어는 쓰기 방향이 오른쪽에서 왼쪽으로이며, 특이한 소리와 발음 구조를 가지고 있습니다. 3. 핀란드어 핀란드어는 핀란드와 에스토니아를 주..