Sigmoid는 설계 결정이 아니라 수학적 정리입니다. BM25 점수를 확률로 변환하는 유일하게 유효한 함수가 왜 sigmoid인지를 보이고, Robertson의 확률적 순위 원리(PRP)가 50년 만에 어떻게 완성되었는지를 설명합니다.

Read Post

현대 검색 시스템에서 어휘 매칭과 의미적 이해를 결합하는 것은 근본적인 과제입니다. Cognica Database에서 BM25 점수를 보정된 확률로 변환하여 텍스트 검색과 벡터 검색 결과의 근본적인 결합을 가능하게 하는 확률적 랭킹 프레임워크를 어떻게 구축했는지 살펴봅니다.

Read Post

Copy-and-Patch JIT 개발과 디버깅을 실용적으로 만드는 필수 인프라를 소개합니다. 검증을 위한 다중 아키텍처 디스어셈블러와 크로스 플랫폼 테스트 및 디버깅을 위한 소프트웨어 CPU 에뮬레이터를 살펴봅니다.

Read Post

Cognica 데이터베이스 엔진이 JIT 컴파일의 지연 시간 장벽을 허무는 방법을 살펴봅니다. 바이트코드 킬로바이트당 1밀리초 미만의 컴파일 시간을 유지하면서 인터프리터 대비 2-10배의 속도 향상을 달성하는 Copy-and-Patch JIT 컴파일 기술을 소개합니다.

Read Post

벡터 검색에서 NOT 연산이 어려운 이유를 설명합니다.

Read Post

LLM 컨텍스트를 순간적으로 재구성하는 방법을 제안합니다.

Read Post

We know that terms like big data, data lakes, and web-scale are fancy and attractive, but those are only everyday issues for very few of us. Most companies will never deal with the petabytes scale of the data. Let's be practical and stay on the ground. Most companies just need a simple but powerful database system to solve real problems. We are here to build a product for most companies, not just for unicorns. Our mission is to solve the common problems often associated with existing database systems and simplify software development by keeping your software stacks as simple as possible.

Read Post