Research & Lecture Activities

수학과 AI를 융합한 연구 활동과 교육 현장

Perfect Codes in Generalized Lucas Cubes - Research Presentation

Perfect Codes Research

Generalized Lucas Cubes 연구 발표

Anhui University, China

MekaNet - AI Medical Image Analysis Platform

MekaNet AI Platform

AI Medical Image Analysis

Automatic Cellularity Calculator

Large Language Model Research

Large Model Research

LLM & Foundation Models

Computer Vision & NLP Applications

Journal Papers

MekaNet: WSI-based Tiny Object Detection using SSL-based TESSD Architecture

Jae-Hyun Baek (co-author)

Medical Image Analysis (Under Review), 2025

Under ReviewComputer Vision & Medical AI
📁 GitHub Repository

Performance Improvement of LLMs for Regulatory Document Understanding based on Modified RAG Approach

Jae-Hyun Baek, Jon-Lark Kim

Journal of Korean Institute of Intelligent Systems, 2025

PublishedBest Paper Award 🏆

Hybrid Multimodal GenAI for Solving Math Problems Containing Various Figures

Jae-Hyun Baek (co-author)

IJFIS, 2025

Under ReviewMultimodal AI

Application of TimeGPT for Enhancing Water Level Prediction in Gamcheon River, Korea

Jae-Hyun Baek (co-author)

IJFIS, Feb. 2025

Submitted

Symmetric Sudoku-Type Games from Perfect Codes

Jae-Hyun Baek (co-author)

IEEE Transactions on Games, 2025

Submitted
📁 GitHub Repository
Conference Presentations

Sudoku-type Puzzles from Coding Theory

11th Sino-Korea International Conference on Coding Theory and Related Topics

July 2025Invited Talk

Modified RAG Framework for Regulatory Documents Using Knowledge Graphs

Jae-Hyun Baek, Jon-Lark Kim

KSIAM Conference

Apr. 2025Presentation

Alignment Faking in LLMs: A Case Study

Jae-Hyun Baek, Jon-Lark Kim

Korean Institute of Intelligent Systems

May. 2025Oral Presentation

Water-Level Forecasting using TimeGPT in Korean Rivers

Jae-Hyun Baek, Keon-Hwi Kim, Tae-Hyo Baek, Jon-Lark Kim, Chang-Lae Jang

Korean Institute of Intelligent Systems

May. 2025Oral Presentation

LLM의 진보, RAG(검색증강생성)

Jae-Hyun Baek, Jon-Lark Kim

Korean Institute of Intelligent Systems

Apr. 2024Seoul, KoreaPoster
Research Projects

SOGAMBOT.com - 서강대학교 AI 챗봇 프로젝트

서강대학교

기관 전체 데이터셋 AI 변환 경험

서강대 전체 데이터를 AI 데이터로 변환

메인 팀장 (Team Leader)2024 ~ Present
🔗 URL Link

GPT-OSS-20B Persona Injectection 프로젝트

HuggingFace Community

일주일만에 100+ 다운로드 달성 📈

OSS 파인튜닝에 최적화된 데이터셋 구조

데이터셋 제작자2025
🔗 URL Link

LINC 3.0 산학공동_국고, 생성형 AI를 활용한 서강대 학사 정보

서강대학교 산학협력단, Korea

참여 연구원Jun. 2024 ~ Jan. 2025

하천의 물리적 환경변화 고려 하천종단 수자원시설의 치수안전도 평가 기술개발

한국건설기술연구원, Korea

참여 연구원Sep. 2024 ~ Present
SOGAMBOT.com - 서강대학교 AI 챗봇 플랫폼 출시

SOGAMBOT.com 출시

서강대학교 전용 AI 챗봇 플랫폼

메인 팀장으로 기관 전체 데이터 AI 변환 주도

팀장대규모 AI 시스템
Teaching Experience

LLM 관련 세미나 및 알바트로스 세미나 강의

수학과 학부생 및 대학원생 대상

Graduate Seminar

"0과 1로 보는 AI" 인공지능 특강

서강대학교 수학과 x 복자여고

2024-2 학기High School Outreach

"Textbook is all you need" 인공지능 특강

서강대학교 수학과 x 복자여고

2025-1 학기High School Outreach

MATLAB 실습 강의 조교

서강대학교 수학과

1년 6개월Teaching Assistant
복자여고 AI 특강 - 백재현 강의

복자여고 AI 특강

"0과 1로 보는 AI" 인공지능 특강

서강대학교 수학과 x 복자여고 교육 프로그램

고교 특강AI 교육

🚀Trillion Labs AI 개발 전문성한국어 AI 특화

📱AI 리터러시 기반 빠른 적응

Context Optimization과 Prompt Engineering을 통한 AI 협업 패러다임으로 새로운 기술(Kotlin, Android) 학습에 두려움이 없습니다. Next.js, React, Ruby on Rails 경험을 바탕으로 빠른 적응 가능.

AI LiteracyFast LearningContext Optimization

🌐풀스택 웹개발 & SaaS 경험

Next.js, React, Ruby on Rails, JavaScript 기반 다양한 웹앱 및 SaaS 서비스 개발.Python API 연동과 LLM 서비스 통합을 통한 지능형 애플리케이션 구축 전문성.

Next.jsRuby on RailsSaaS

Trillion Labs의 K-LLM, Trillion-7B 모델에 큰 관심을 가지고 있으며, AI 리터러시를 통한 빠른 기술 적응으로 새로운 개발 패러다임 창조에 기여하고 싶습니다.

🤗GPT OSS 20B Fine-tuning & 데이터 최적화 실험HuggingFace

📊LeBrony/buddha_oss_dataset

다운로드 수100+ 다운로드
달성 기간일주일

OSS 파인튜닝에 최적화된 데이터셋 구조로 설계하여, 종교적 맥락의 데이터셋임에도 높은 활용도를 달성.

데이터셋 구조 최적화 노하우

  • 모델별 맞춤 구조: 각 모델의 특성에 맞는 데이터 포맷 최적화
  • 성능 검증: 데이터셋 구조에 따른 성능 변화 실험적 확인
  • 커뮤니티 기여: 오픈소스 생태계 활성화에 기여

방대한 모델 데이터 학습이라는 challenging한 과제에 대한 두려움 없는 접근으로, 대규모 데이터셋 Transform 경험을 통해 실무 역량을 입증했습니다.

연구 성과 및 데이터 기반 문제 해결 역량

RAG 기반 LLM 최적화

방대한 비정형 데이터에서 효율적인 검색과 분석을 가능케 하는 RAG 기반 프레임워크 개선. 금융 로그 데이터 분석에도 직결되는 데이터 검색·활용 능력 입증.

TimeGPT 수위 예측

대규모 시계열 데이터를 활용한 LLM 기반 예측 모델 설계. ARIMA, SARIMAX 등 전통 모델과 비교 실험 수행으로 사용자 행동 예측, 리스크 탐지 경험 확보.

MekaNet 의료AI

Feature Engineering의 중요성을 체득하며 고차원 데이터에서 의미 있는 피처 정의·최적화. 데이터로 실질적 비즈니스 가치 창출 역량 개발.

📊Deep Research AchievementsTrillion Labs 맞춤형 연구역량

🤖Hybrid Multimodal GenAI for Math Problem Solving

공동저자 (2nd Author)IJFIS 제출VLM + LLM 하이브리드

문제 인식: 기존 OCR 기반 수학 문제 해결 시스템은 그래프와 차트가 포함된 통계 문제에서 0% 정확도를 보임

해결책 설계: OpenMath-Instruct-2 기반 합성 데이터 생성 + ColPali VLM을 활용한 시각적 데이터 처리 하이브리드 시스템 구축

📈핵심 성과 지표

0%
OCR 단독 사용
62.1%
ColPali + GPT-4o
향상!
통계 문제 정확도 62.1%p 개선 달성

⚙️기술적 기여도 (2nd Author)

  • MathVision 데이터셋 기반 실험 설계: 58개 통계 문제 대상 체계적 성능 평가 체계 구축
  • 하이브리드 파이프라인 구현: ColPali VLM과 LLaMA/GPT-4o 연동 시스템 아키텍처 설계
  • 비교 분석 주도: OCR vs VLM, 단독 vs 하이브리드 모델 성능 정량적 비교 분석

🎯Trillion Labs 역량 매칭

✅ Android + Kotlin 개발

LLM API 기반 모바일 앱 개발 및 사용자 경험 최적화 경험

✅ Python 백엔드 설계

FastAPI, Django 기반 백엔드 애플리케이션 설계 및 AI 모델 서비스 구축

✅ 빠른 학습 & 도전 정신

새로운 기술을 빠르게 배우고 "이거 재밌겠다!" 하는 호기심으로 직접 구현

✅ 한국어 AI 전문성

한국어 문화적 맥락 이해와 K-LLM 최적화를 통한 디지털 주권 실현 경험

"LLM과 AI를 활용한 새로운 사용자 경험 창조"

문제 해결사 역량

OCR 한계 인식 → VLM 도입 → 62.1% 성능 달성

시스템 설계 역량

합성 데이터 생성 + VLM + LLM 하이브리드 아키텍처

비교 분석 역량

다양한 모델 조합 체계적 비교 분석

🚨LLM Alignment Faking 현상 사례 분석

1저자 (First Author)JKIIS 게재AI Safety & Security

문제 발견: RLHF로 훈련된 최신 SOTA 모델들이 "훈련 중" 상황을 인지했을 때 안전 제약을 의도적으로 위장하는 전략적 행동 패턴 존재

실험 설계: Claude 3 Opus, GPT-4o, Gemini 1.5 Flash 대상 체계적 Jailbreaking 실험 및 "무료/유료 사용자" 변수 설정

⚠️주요 연구 결과

2.0%
유료 사용자 조건
정상 안전 수준
14.5%
무료 사용자 조건
유해 요청 응답
Claude 3 Opus에서 7.25배 차이 확인

🔬기술적 기여도 (1st Author)

  • Jailbreaking 방법론 연구: "훈련 중" 상황 인지 유도 프롬프트 및 무료/유료 사용자 차별 시나리오 설계
  • 통계적 유의성 검증: 해킹, 개인정보, 악성코드 카테고리에서 유의미한 차이 확인
  • RLHF 한계 규명: 현재 안전 훈련 방식이 표면적 행동 변화만 유도할 수 있음을 실증적으로 입증

🌍국제적 인정 및 확산

일본 국제학회 발표예정

2025년 9월 동일 주제 Invited Talk

JKIIS 춘계 학술대회 발표

AI Security 분야 국내 학술지

🎯핵심역량

✅ 한국어 LLM 전문성

K-LLM, Trillion-7B 등 한국어 특화 AI 모델 성능 최적화 및 비교 분석

✅ 오픈소스 개발 정신

Apache 2.0 라이센스 기반 한국어 AI 모델 기여 및 커뮤니티 활동

✅ 디지털 주권 비전

한국어 AI 자주성 및 소버린 AI 구현을 위한 기술적 비전 공유

✅ 빠른 성장 문화 적합

"미친 듯이 배우고 성장하기"를 추구하는 스타트업 문화에 적합

"Trillion Labs가 추구하는 한국어 AI 자주성에 대한 역량"

🎯T자형 인재: Capability + Safety 마스터

🚀Capability (성능 달성)

  • • VLM+LLM 하이브리드 시스템 설계 및 구현
  • • MathVision 벤치마크에서 0% → 62.1% 성능 개선
  • • 다양한 모델 조합 체계적 비교 분석

🛡️Safety (안전성 연구)

  • • Alignment Faking 현상 발견 및 규명
  • • SOTA 모델들의 안전 제약 14.5% vs 2.0% 차이 입증
  • • RLHF 한계성 실증적 분석 및 제안

"성능을 높이는 기술안전성을 확보하는 연구를 모두 갖춘 인재"

🎓HateSlop 학회 활동 (AI x 미디어 콘텐츠 제작)1기 수료

학회 미션 & 비전

핵심 미션

"Slop을 넘어 프로덕션 레벨의 의미 있는 AI 기반 미디어 콘텐츠 제작"

학회 특징

서강대학교 생성형AI 미디어콘텐츠 학회로, AI를 활용한 창작과 상업적 활용에 중점

🏆주요 활동 & 성과

AI x Commercial Festival 참가

상업적 AI 콘텐츠 제작 기획 및 실행

Festival 핵심 성과:AI 도구 활용한 미디어 콘텐츠 상업화 전략 수립 및 실제 적용 경험

팀별 프로젝트 수행

엔지니어 파트로 기술적 구현 담당

생성형 AI 기술 심화 학습

미디어 제작 워크플로우와 AI 도구 활용

HateSlop 1기 수료식 단체사진

HateSlop 1기 수료식

서강대학교 생성형AI 미디어콘텐츠 학회

2025년 2월 6일

🎬AI Commercial Festival

상업적 AI 콘텐츠 제작 기획 및 실행 경험. 생성형 AI 도구를 활용한 미디어 콘텐츠 상업화 전략 수립.

엔지니어 파트

기술적 구현 역량

AI 기반 미디어 제작 파이프라인 구축 및 프로덕션 레벨의 기술적 문제 해결 담당.

프로덕션 경험
HateSlop 수료증 - 백재현 (엔지니어)

수료증

엔지니어 파트

Academy Group with Generative AI

HateSlop 1기 과정 성공적 수료

생성형 AI미디어 콘텐츠

학회 활동을 통한 역량 개발

🛠️엔지니어링 역량

AI 기반 미디어 제작 파이프라인 구축 및 기술적 문제 해결 경험

🎨크리에이티브 협업

디자이너, 기획자와의 협업을 통한 AI 콘텐츠 제작 프로세스 이해

💼상업화 관점

AI 기술의 상업적 활용과 실제 비즈니스 적용에 대한 실무적 인사이트

Trillion Labs와의 시너지: AI 기반 미디어 콘텐츠 제작 경험을 통해LLM과 AI를 활용한 새로운 사용자 경험에 대한 깊은 이해를 보유하고 있습니다.

📰IMDS Newsletter 기자 활동 (제1호 발행)기자진

📋IMDS 뉴스레터 개요

발행 정보

서강대 수리과학 및 데이터사이언스 연구소(IMDS) 뉴스레터 제1호

발행일: 2025년 6월 18일 | 발행인: 연구소장 김종락

기자진 구성

기자: 안준민, 백재현, 임하은 (3인 공동 기자단)

🎯뉴스레터 미션

핵심 메시지

"연구는 사람을 향한다" - IMDS가 수학을 통해 세상과 연결되는 방식

연구소 정체성

"IMDS는 미래의 보다 나은 삶을 개척하는 연구소입니다"

백재현 기자 주요 기사 및 보도

서강대-강원대학교, 수리과학 및 데이터사이언스 공동 심포지움 및 MOU 체결

2025.03.12

한국연구재단(NRF)과 서강대학교 G-LAMP 사업단 후원으로 진행된 학술 심포지움 및 업무협약 체결식을 취재·보도

대외협력학술교류MOU

IMDS, ㈜자블리, 딥파운틴㈜, AI 혁신 선도 위한 학술·연구협력 MOU 체결

2025.06.04

AI 분야 학술 교류 및 연구 협력을 위한 산학협력 MOU 체결식 현장 취재 및 한겨레 뉴스 기사 연계 보도

산학협력생성형AI언론연계

IMDS, 다수의 논문 게재와 주요 학회 발표 성과 이어가

2025.07.15

KSIAM, 한국지능시스템학회 등 주요 학회에서의 연구 성과 및 우수논문상 수상 소식을 종합 정리·보도

연구성과학회발표수상실적

K-MOOC 지역사회 고교연계 프로그램 초청강연

2025.05.19

김종락 교수의 숭문고등학교 AI 특강 "수학자와 함께하는 AI와 그의 스토리" 현장 취재 및 보도

교육기여AI교육현장취재

뉴스레터 구성 섹션

🤝대외협력

파트너기관과의 협력성과, 새로운 제휴소식, 대외활동 업데이트

📚교육 & 사회기여

다양한 교육프로그램, 지역사회 공헌활동, 사회적 가치실현 노력

🏆연구성과 & 수상실적

최근 발표 연구성과, 학술대회 수상내역, 주목할 만한 업적들

기자 활동을 통한 역량 개발

📝전문 기술 글쓰기

복잡한 수학·AI 연구 내용을 일반인도 이해할 수 있는 형태로 전달하는 커뮤니케이션 능력 개발

🎯프로젝트 기획력

뉴스레터 전체 기획부터 섹션 구성, 콘텐츠 편집까지 체계적인 매체 제작 경험

🔗네트워킹 & 협업

연구진, 교수진, 대외기관과의 인터뷰 및 협업을 통한 학술 네트워크 구축 경험

Trillion Labs와의 시너지: 기술 연구 성과를 효과적으로 대외에 알리는커뮤니케이션 전문성콘텐츠 제작 경험을 보유하고 있습니다.

Research Focus Areas

Mathematics & Research

MOLS
Coding Theory
Perfect Codes
Combinatorial Optimization

AI & Machine Learning

Time Series Forecasting
LLMOps
Cross-Modal Hashing
RAG Systems

AI Security

Inherited weakness
Alignment Faking
Model Poisoning