[Paper Review] GraphMAE2: A Decoding-Enhanced Masked Self-Supervised Graph Learner (WWW 2023)
·
Paper Review
GraphMAE2: A Decoding-Enhanced Masked Self-Supervised Graph Learner (WWW 2023)Abstract그래프 자기 지도 학습(SSL)의 중요성실제 그래프 데이터는 레이블이 부족한 경우가 많습니다.그래프 SSL은 이러한 레이블 부족 문제를 해결할 잠재력이 큽니다.SSL은 크게 대조 학습(contrastive) 방식과 생성(generative) 방식으로 나뉨마스크된 그래프 오토인코더(Masked Graph Autoencoders)의 등장생성 방식 중 하나로 GraphMAE와 같은 마스크된 그래프 오토인코더가 최근 유망한 결과를 보여주었습니다.기본 아이디어는 입력에서 무작위로 마스크된 노드 특징(또는 구조)을 오토인코더 아키텍처를 사용하여 재구성기존의 "Ma..
[Paper Review] Text Embeddings Reveal (Almost) As Much As Text (EMNLP 2023)
·
Paper Review
Text Embeddings Reveal (Almost) As Much As Text (EMNLP 2023)John X. Morris, Volodymyr Kuleshov, Vitaly Shmatikov, Alexander M. RushAbstract연구 질문: "텍스트 임베딩은 원본 텍스트에 담긴 개인 정보를 얼마나 많이 드러내는가?"핵심 문제: 임베딩 역변환(Embedding Inversion) -> 텍스트 임베딩 벡터로부터 해당 텍스트를 재구성하는 것입니다.접근 방식: 이 문제는 "제어된 생성(Controlled Generation)" 문제로 프레임화됩니다. 즉, 주어진 임베딩에 최대한 가까운 텍스트를 생성하는 것을 목표로 합니다.실험결과 및 발견단순한(naïve) 모델은 임베딩만으로는 성능이 좋지 ..
[Paper Review] SAC-KG: Exploiting Large Language Models as Skilled Automatic Constructors for Domain Knowledge Graphs (ACL 2024)
·
Paper Review
SAC-KG: Exploiting Large Language Models as Skilled Automatic Constructors for Domain Knowledge Graphs (ACL 2024)Hanzhu Chen, Xu Shen, Qitan Lv, Jie Wang, Xiaoqi Ni, Jieping YeAbstractMotivation: 본 연구에서는 도메인 지식 그래프 (Domain Knowledge Graphs, KGs) 구축에 있어 기존 방법들이 수동 작업에 크게 의존하여 실제 적용이 어렵다는 문제를 해결하고자 합니다. 이를 위해 SAC-KG라는 새로운 프레임워크를 제안합니다.SAC-KG의 목표: LLM (Large Language Models)을 활용하여 전문적이고 정확한 다단계 지식 ..
[Paper Review] A Variational Approach for Mitigating Entity Bias in Relation Extraction (ACL 2025)
·
Paper Review
A Variational Approach for Mitigating Entity Bias in Relation Extraction (ACL 2025)Samuel Mensah, Elena Kochkina, Jabez Magomere, Joy Prakash Sain, Simerjot Kaur, Charese SmileyAbstract관계추출 Task & 문제점 인식관계 추출(RE): 텍스트 내에서 두 엔티티(예: 사람 이름, 회사 이름) 사이의 의미 있는 관계(예: '직원', '창립자')를 식별하고 분류하는 자연어 처리 태스크입니다.관계 추출(RE) 모델들은 종종 엔티티에 과도하게 의존하는 경향(entity bias)이 있어, 이로 인해 모델의 일반화(generalization) 능력이 저하되는 심각한 문제..
[Paper Review] NeuroMax: Enhancing Neural Topic Modeling via Maximizing Mutual Information and Group Topic Regularization (EMNLP 2024 Findings)
·
Paper Review
NeuroMax: Enhancing Neural Topic Modeling via Maximizing Mutual Information and Group Topic Regularization (EMNLP 2024 Findings)Duy-Tung Pham, Thien Trang Nguyen Vu, Tung Nguyen, Linh Van Ngo, Duc Anh Nguyen, Thien Huu NguyenAbstractNeural Topic Model 의 최신 동향과 문제점최근 신경 토픽 모델 연구는 두 가지 주요 방향에 집중하고 있습니다.Generative model 인코더(Inference network, 주로 VAE 인코더)와 Pre-trained Language Model (PLM)의 통합: 이는 토픽..
[Paper Review] Groupwise Query Specialization and Quality-Aware Multi-Assignmentfor Transformer-based Visual Relationship Detection (CVPR 2024)
·
Paper Review
Groupwise Query Specialization and Quality-Aware Multi-Assignmentfor Transformer-based Visual Relationship Detection (CVPR 2024)AbstractVisual Relationship Detection (VRD)은 이미지 내 객체들 [주체 (subject), 객체 (object)] 과 그들 사이의 관계(relationship)를 감지하는 컴퓨터 비전의 중요한 task입니다. 최근 Transformer 기반 아키텍처가 VRD 분야에서 상당한 발전을 이루었지만, 연구자들은 Transformer 기반 VRD 모델을 훈련하는 데 사용되는 기존의 라벨 할당 방식에서 두 가지 주요한 한계를 발견했습니다.기존의 라벨 할당 ..
[Paper Review] CEMTM: Contextual Embedding-based Multimodal Topic Modeling (EMNLP 2025)
·
Paper Review
CEMTM: Contextual Embedding-based Multimodal Topic ModelingAmirhossein Abaskohi, Raymond Li, Chuyuan Li, Shafiq Joty, Giuseppe CareniniAbstractCEMTM: 텍스트와 이미지를 모두 포함하는 짧고 긴 문서에서 일관성 있고(coherent) 해석 가능한(interpretable) 토픽 구조를 추론하도록 설계된 "context-enhanced multimodal topic model"입니다.모델의 주요 구성 요소 및 작동 방식Fine-tuned LVLMs 활용: Fine-tuned Large Vision Language Models (LVLMs)를 기반으로 문맥화된 임베딩(contextualized ..
[Paper Review] Encryption-Friendly LLM Architecture (ICLR 2025)
·
Paper Review
Encryption-Friendly LLM Architecture (ICLR 2025)Donghwan Rho*, Taeseong Kim*, Minje Park, Jung Woo Kim, Hyunsik Chae, Ernest K. Ryu† , Jung Hee Cheon†ABSTRACT문제 제기: 사용자 상호작용을 기반으로 개인 맞춤 응답을 제공하는 LLM 서비스는 편리하지만, 이 과정에서 사용자의 민감한 데이터가 노출될 수 있다는 심각한 프라이버시 문제를 야기합니다. 동형암호(HE) 소개: HE는 암호화된 상태에서 산술 연산을 수행할 수 있는 암호화 프로토콜로, 데이터 프라이버시를 보호하면서 머신러닝을 수행하는 프라이버시 보존 머신러닝(PPML) 분야의 잠재적 해결책으로 주목받고 있습니다. HE 외에도 P..