대규모 언어 모델(LLM)을 활용하여 다양한 형식의 PDF 재무제표를 자동으로 추출하고 정규화하는 시스템 구축 과정을 소개합니다. Structured Output과 Pydantic을 활용한 데이터 모델 설계, Google Gemini API를 통한 추출 프로세스, 그리고 실무에 적용 가능한 후처리 방법까지 200줄의 코드로 구현하는 방법을 다룹니다.

Read Post

Monic 프레임워크는 단일 /compute 엔드포인트를 통해 클라이언트의 의도를 계산식으로 표현하도록 하여, REST의 엔드포인트 폭발 문제를 해소하고 API를 데이터베이스와 통합된 "계산 인터페이스(Computational Interface)"로 재정의합니다.

Read Post

벡터 검색에서 NOT 연산이 어려운 이유를 설명합니다.

Read Post

벡터 임베딩 한계와 특성을 설명하고 이를 저장하기 위한 기능 개선 내용을 다룹니다.

Read Post

FTS를 사용한 판례 검색 데모에 벡터 검색을 적용하여 자연어 검색 서비스를 구축하는 방법을 설명합니다.

Read Post

판례 데이터를 다운로드 받고 Cognica를 통해 판례 검색 서비스를 하루만에 구축한 과정을 설명합니다.

Read Post

Cognica를 활용하여 상품 검색을 위한 데이터 수집 및 가공, 검색과 서비스 개발 과정을 설명합니다. 정형, 비정형 데이터가 혼합되어 있을 때 어떻게 색인하고 LLM을 활용하여 어떻게 쿼리를 변환하여 검색하는지를 알아봅니다.

Read Post

Copyright © 2024 Cognica, Inc.

Made with ☕️ and 😽 in San Francisco, CA.