인스트럭트-한국 2025 1월 Meetup
행사가 모집 시작 하루 만에 마감 되었습니다.
하지만 Waiting List 에 신청 해주시면 신청 취소 하시는 분이 있으면 바로 등록하실 수 있도록 조치 하겠습니다.
행사 소개
2024년 인스트럭트한국 커뮤니티 https://instruct.kr
는 LogicKor
리더보드 출시와 함께 약 700 여명의 연구자들이 자발적으로 자신의 성과를 공유하는 대한민국 최대의 오픈소스 언어모델 커뮤니티가 되었습니다.
2025년 새해를 맞이하여 인스트럭트한국 디스코드 커뮤니티 회원 여러분의 연구 동향과 소식을 공유하고 네트워킹을 할 수 있는 자리를 마련해보고자 합니다. 이번 밋업의 주제는 "언어모델을 연구하는 나의 아이디어와 도전들" 입니다. 다른 사람들의 경험도 듣고, 자신의 연구 아이디어도 공유하고, 다양한 의견을 가진 사람들이 교류하기를 희망 합니다.
행사는 2025년 1월 25일 (토요일) 14~18시
장소는 강남역 인근 논스 (역삼동 624-17) 입니다.
문의사항: https://instruct.kr
장소 후원: 논스 커뮤니티 (https://nonce.community/)
발표자 소개
고석현 (Sionic AI): Java 외에 다른 언어를 쓰면 호흡이 곤란해지는 병에 걸렸는데 AI 회사 같은 걸 추구하면 안 되는 걸까
Java & Kotlin 언어로 자연어 처리에서 진행하는 이야기를 들려 줍니다. 특히 production level 에서 파이썬 기반 딥러닝 코드를 JVM 언어로 포팅하여 서빙하는 경험에 대해 이야기 합니다.
김지수 (kuotient, 올거나이즈): Qwen2.5 한국어 모델 개발기
"Qwen2.5 한국어 모델 개발기"를 통해 혁신적인 언어 모델 개발 과정을 공유합니다. 특히 m-ArenaHard에서 37.60이라는 인상적인 성능 향상을 이끈 과정이 주목됩니다. SFT, Merging, Alignment 등 전반적인 학습 파이프라인을 다루며, 레이어 교체와 On-policy 전략 도입 등 국내 최초로 시도된 기술적 혁신도 함께 소개됩니다. 8B 이하 모델 중 최고 성능을 기록한 비결을 상세히 들려줄 예정입니다.
박정환 (instruct.kr, Wanot AI) : 토큰 생성이 항상 정답은 아니다 - Task에 따른 파인튜닝 방법 탐구
일반적으로 파인튜닝을 진행할때에 next token prediction을 training objective로 설정한다. 하지만 대부분에 task에서는 그것이 최선이 아닐 수 있다. 본 발표에서는 모델의 출력부를 변형하여 task에 적합한 training objective를 설정하고, 그것을 next token prediction(CE)와 비교해본다.
이승유 (dopeornope, 마커 AI): LLM 가이던스 및 Quantization
"LLM 가이던스 및 Quantization"을 주제로, 급속도로 발전하는 LLM 기술의 최신 동향을 조명합니다. 최근 활발히 연구되는 LLM 가이던스와 quantization 기술의 개념과 발전 방향성에 대한 통찰력 있는 분석을 제공합니다.
유용상: KRX 금융 언어 모델 경진대회 후기
"KRX 금융 언어 모델 경진대회 후기"를 통해 도메인 특화 모델 개발의 실전 노하우를 공유합니다. MCQA 벤치마크 성능 향상을 위한 domain adaptation과 continual pretraining 전략, 그리고 safety auditing에 대한 깊이 있는 내용을 다룹니다.
최선웅: RAG 개발 프로젝트 이야기
실제 RAG 개발 프로젝트의 생생한 현장 경험을 공유합니다. 특히 프로젝트 진행 과정에서 발견된 문제점들을 솔직하게 짚어보고, 이를 통해 얻은 교훈과 개선 방향을 제시할 예정입니다.
장영준 (yjoonjang) : 한국어 임베딩 모델
"한국어 임베딩 모델" huggingface.co/nlpai-lab 을 주제로 다양한 임베딩 모델의 특징과 실제 학습 과정에서의 핵심 포인트를 공유합니다. 임베딩 모델의 선택부터 학습까지, 실무에 바로 적용할 수 있는 인사이트를 전달할 예정입니다.
정세민 (Sionic AI) : Graph RAG로 Recsys 만들기 - Storm fooding
"Graph RAG로 Recsys 만들기 - Storm fooding"을 주제로, 그래프 기반 RAG 시스템을 활용한 추천 시스템 개발 경험을 공유합니다. 시스템 설계부터 구현까지의 전체 과정을 다룰 예정입니다.
김동규 (Jeffrey Kim, AutoRAG) : 깃허브 스타 3천개 받아보기
"깃허브 스타 3천개 받아보기"라는 주제로, AutoRAG 오픈소스 프로젝트의 성장 스토리를 들려줍니다. 프로젝트의 시작부터 성공적인 오픈소스화까지의 여정과 앞으로의 발전 방향을 공유합니다.
유대곤 (dragonkue) : Retriever 모델 구축 경험 공유(semantic, ensemble, reranker)
Semantic retriever, ensemble retriever, reranker 구축 경험에 대해 공유합니다. dragonkue 님은 세간에 유명한 https://huggingface.co/dragonkue/BGE-m3-ko 임베딩 모델과 https://huggingface.co/dragonkue/bge-reranker-v2-m3-ko 리랭커 모델을 공개하신 바 있습니다.