Research
Cognica는 출판된 수학적 기반 위에 구축되었습니다. 모든 기능은 엔지니어링 휴리스틱이 아닌 제1원리에서 도출됩니다.
Mathematical Framework
대수적 기반에서 그래프 확장, 확률적 보정을 거쳐 신경 계산 이론으로 이어지는 연구 흐름.
Industry Adoption
Bayesian BM25는 주요 검색 엔진 및 정보 검색 프레임워크에 도입되었습니다.
Apache Lucene
가장 널리 사용되는 오픈소스 검색 라이브러리. Bayesian BM25를 핵심 스코어링 옵션으로 통합.
MTEB Baseline
Massive Text Embedding Benchmark에서 Bayesian BM25를 검색 평가의 공식 베이스라인으로 채택.
Vespa.ai
Yahoo의 대규모 서빙 엔진. Bayesian BM25를 공식 랭크 프로파일 예제로 포함.
txtai
올인원 임베딩 데이터베이스. 확률적 하이브리드 검색 파이프라인을 위해 Bayesian BM25 추가.
Publications
A Unified Mathematical Framework for Query Algebras Across Heterogeneous Data Paradigms
포스팅 리스트를 관계형, 텍스트 검색, 벡터 검색 패러다임을 통합하는 보편적 수학적 추상화로 확립. 불리언 대수를 통한 합성적 완전성 증명.
Extending the Unified Mathematical Framework to Support Graph Data Structures
통합 대수를 그래프 연산으로 확장하여, 그래프 순회와 패턴 매칭이 모든 패러다임에서 대수적 완전성을 보존함을 증명.
Bayesian BM25: A Probabilistic Framework for Hybrid Text and Vector Search
시그모이드 우도를 사용한 베이지안 추론으로 BM25 점수를 보정된 확률로 변환. RRF나 임의적 정규화 없이 원칙적 하이브리드 검색 가능.
From Bayesian Inference to Neural Computation
제1원리 베이지안 추론에서 피드포워드 신경망 구조 도출. Sigmoid, ReLU, Swish, GELU가 서로 다른 확률적 질문에서 자연스럽게 나타남을 증명.
Vector Scores as Likelihood Ratios: Index-Derived Bayesian Calibration for Hybrid Search
ANN 인덱스 구축 과정의 분포 통계를 활용한 벡터 유사도 점수의 베이지안 보정. 희소-밀집 검색의 확률적 통합 완성.
시그모이드의 유계 출력이 기울기 흐름과 무관하게 표현 용량을 파괴하는 응답 대역폭 압축을 근본 메커니즘으로 규명. 기울기 소실을 넘어서는 새로운 설명 제시.
Product of Experts가 MLP, CNN, ResNet, Transformer에서 역전파 대비 2% 이내의 정확도를 달성하는 원칙적 로컬 학습 프레임워크임을 증명. 지속 학습에서의 구조적 이점 확립.
정보 검색과 신경망 추론을 연결: Block-Max WAND를 적용하여 순전파 중 무시 가능한 뉴런을 건너뜀. ReLU 활성화의 지수 사전분포를 이용해 하이퍼파라미터 없이 뉴런별 활성화 한계를 도출.