Insights18 min read
모델과 하드웨어 사이, 비어 있는 계층
by Jaepil Jeong | April 10, 2026
모델과 하드웨어 사이에 있어야 할 데이터 계층이 파편화되어 있고, 온디바이스에서는 거의 존재하지 않습니다. 이것이 왜 구조적 문제인지, 현재의 해법들이 왜 진짜 해법이 아닌지, 그리고 올바른 해법이 갖춰야 할 조건은 무엇인지 분석합니다. 이 조건들에 대한 하나의 구체적 응답으로 UQA와 Cognica 엔진을 제시합니다.
Read Post
Tech4 min read
통합 데이터베이스에서의 그래프 쿼리: Cypher에서 포스팅 리스트까지
by Jaepil Jeong | March 26, 2026
그래프 데이터베이스는 관계 중심 문제를 효과적으로 해결하지만, 관계형 데이터베이스와 별도로 운영하면 운영 복잡성이 증가합니다. Cognica가 그래프 쿼리를 통합 대수에 어떻게 통합하여, 데이터 중복 없이 Cypher와 SQL을 하나의 트랜잭션으로 합성하는지 설명합니다.
Read Post
Research5 min read
벡터 점수는 확률이 아니다: 하이브리드 검색을 위한 우도비 보정
by Jaepil Jeong | March 25, 2026
코사인 유사도 0.85는 각도이지, 확률이 아닙니다. ANN 인덱스가 이미 계산하는 분포 통계를 활용하여 벡터 유사도 점수를 보정된 적합성 확률로 변환하는 방법을 설명합니다. 텍스트와 벡터 검색의 확률적 통합을 완성합니다.
Read Post
Research9 min read
왜 Sigmoid인가? Bayesian BM25 뒤에 숨겨진 수학적 필연성
by Jaepil Jeong | February 23, 2026
Sigmoid는 설계 결정이 아니라 수학적 정리입니다. BM25 점수를 확률로 변환하는 유일하게 유효한 함수가 왜 sigmoid인지를 보이고, Robertson의 확률적 순위 원리(PRP)가 50년 만에 어떻게 완성되었는지를 설명합니다.
Read Post
Tech15 min read
확률적 검색 엔진 구축하기: 베이지안 BM25와 하이브리드 검색
by Jaepil Jeong | February 1, 2026
현대 검색 시스템에서 어휘 매칭과 의미적 이해를 결합하는 것은 근본적인 과제입니다. Cognica Database에서 BM25 점수를 보정된 확률로 변환하여 텍스트 검색과 벡터 검색 결과의 근본적인 결합을 가능하게 하는 확률적 랭킹 프레임워크를 어떻게 구축했는지 살펴봅니다.
Read Post
Tech18 min read
JIT 툴체인: 데이터베이스 개발을 위한 디스어셈블러 및 CPU 에뮬레이터 구축
by Jaepil Jeong | January 19, 2026
Copy-and-Patch JIT 개발과 디버깅을 실용적으로 만드는 필수 인프라를 소개합니다. 검증을 위한 다중 아키텍처 디스어셈블러와 크로스 플랫폼 테스트 및 디버깅을 위한 소프트웨어 CPU 에뮬레이터를 살펴봅니다.
Read Post
Tech16 min read
Copy-and-Patch JIT: 마이크로초 단위 컴파일로 네이티브 코드 성능 달성하기
by Jaepil Jeong | January 17, 2026
Cognica 데이터베이스 엔진이 JIT 컴파일의 지연 시간 장벽을 허무는 방법을 살펴봅니다. 바이트코드 킬로바이트당 1밀리초 미만의 컴파일 시간을 유지하면서 인터프리터 대비 2-10배의 속도 향상을 달성하는 Copy-and-Patch JIT 컴파일 기술을 소개합니다.
Read Post
Engineering7 min read
벡터 검색에서 NOT 연산이 어려운 이유
by Jaepil Jeong | February 3, 2025
벡터 검색에서 NOT 연산이 어려운 이유를 설명합니다.
Read Post
Research4 min read
순간적으로 재구성하는 컨텍스트: LLM 사용의 새로운 접근
by Jaepil Jeong | December 15, 2024
LLM 컨텍스트를 순간적으로 재구성하는 방법을 제안합니다.
Read Post
Company4 min read
Starting a New Journey for the Big Ideas
by Jaepil Jeong | June 13, 2023
We know that terms like big data, data lakes, and web-scale are fancy and attractive, but those are only everyday issues for very few of us. Most companies will never deal with the petabytes scale of the data. Let's be practical and stay on the ground. Most companies just need a simple but powerful database system to solve real problems. We are here to build a product for most companies, not just for unicorns. Our mission is to solve the common problems often associated with existing database systems and simplify software development by keeping your software stacks as simple as possible.







