(주)유알피

인공지능

유알피가 초거대 생성AI 기반의 기업/기관 전용 AI서비스플랫폼을 구축합니다.

문서관리 분야에서 20년간 체득한 고객 니즈를 바탕으로 기존에 볼 수 없었던 혁신적인 서비스를 제공합니다.

데이터워크플로우 기반의 AI플랫폼

데이터 수집, 전처리, 저장, 학습 단계까지 워크플로우 기반으로 플랫폼 구축

  • 데이터 수집

    데이터 수집 설명 이미지
    • RPA 기반 자동 수집 체계
    • (Crawling) 일괄 고속 처리
    • (Scraping) 메타데이터 및 계획된 수집

    문서, 이미지, 음성 등

  • 데이터 정제

    데이터 정제 설명 이미지
    • 텍스트 추출 및 다양한 유형별 전처리
    • 도메인사전 기반 형태소분석
    • 개체명 인식기 (NER)

    정형 및 비정형데이터 처리

  • 데이터 저장

    데이터 저장 설명 이미지
    • 문장 벡터화 및 저장
    • 검색 인덱스 저장
    • 키워드 추출 저장
    • 요약문 생성 저장

    데이터 분석 및 저장

  • 학습

    학습 설명 이미지
    • 고객사 제공 데이터로 Base LLM 추가 학습
    • 서비스 용도에 맞게 튜닝
    • 품질은 유지, 성능은 개선

    사후학습 및 파인튜닝

다양한 규모의 LLM 라인업

유알피의 다양한 LLM 라인업으로 기능 중심의 비용 효율적 시스템 구축

LLM의 크기는 GPU사양과 데이터 규모에 따라 결정되어야 합니다.

유알피의 다양한 LLM라인업을 바탕으로 고객사의 예산규모와 보유데이터 사이즈에 따라 최적의 인프라 구성을 제안합니다.

오픈소스로 기술 최신성 유지

유알피 AI 솔루션은 오픈소스 베이스로 항상 최신 기술Trend를 반영하고 있습니다.

  • LLM
    기술

  • 병렬추론
    기술

  • LLMOps
    기술

  • 병렬학습
    기술

  • 벡터스토어
    (검색엔진)

  • 모델 경량화
    기술

  • 모니터링
    도구

  • 모델성능
    기술

다양한 분야별로 최신기술을 반영한 오픈소스 기술이 지속적으로 개발되어 공개되고 있습니다.

유알피는 오픈소스 베이스로 AI솔루션을 개발하고 있으며, 특히 LLM의 성능과 품질을 개선시키는 기술들을 검토하여 적용하고 있습니다.

  • 인하우스로 개발된 솔루션은 최신 기술을 즉각적으로 반영하기 어렵습니다.
  • 오픈소스는 개발기간을 단축시킬 뿐만 아니라 민첩한 대응을 가능하게 합니다.
  • 상용 요소기술이 사용될 경우 운영단계에서 유지보수 비용이 발생합니다.
  • 오픈소스는 핵심개발자와 기여자의 협력으로 지속적으로 업그레이드되고 있습니다.
  • 오픈소스는 Git 분산버전 컨트롤 시스템 하에서 체계적으로 개발되고 있습니다.

LLM 운영도구 및 프로세스

지속적으로 생산되는 고객사 문서를 학습모델에 반영하고 재학습할 수 있는 도구 제공

AI문서활용 플랫폼 구축

고객사 내부문서 활용을 위한 AI문서활용플랫폼을 구축합니다.

다양한 유형의 전자문서 전처리

고객사가 보유한 다양한 포맷과 유형의 전자문서를 처리할 수 있습니다.

pdf, hwp(x), ODT,
doc(x), ppt(x), xls(x)

고객사가 보유하고 있는 다양한 형태의 전자문서를 그 특성에 따라 전처리

  • [계획문서 유형]

  • [보도자료 유형]

  • [연구보고서 유형]

자체 보유 학습용 데이터셋

LLM 학습을 위한 데이터셋과 도메인 용어사전을 보유하고 있습니다.

  • 모두의 말뭉치
  • 특허 데이터
  • Korean wikipedia
  • Open LLM data
  • AI-Hub datasets
  • KcBert dataset
  • 정보 공개포털
  • 정책연구 보고서
  • Namu wiki
  • Movie corpus
  • Databricks dolly
  • 면접 인터뷰
  • 공개 회의록
  • 한국어 SNS
  • KDI 연구보고서
  • RyokoAI’
  • Anthropic
  • RedPajama
  • 공공 데이터포털
  • 보도자료
  • Open subtitles
  • oasst1
  • 용어 데이터
  • ...

[자체 보유 학습용 데이터셋]

  • 법령 Domain
  • 행정 Domain
  • 금융 Domain
  • 통신 Domain
  • ...

[Domain 용어사전]

고객사 맞춤형 플랫폼 구축

20년 업력의 SI와 인프라 역량으로 고객사 맞춤형 AI플랫폼을 구축합니다.

  • 유알피 LLM
    • 1.3B
    • 2.7B
    • 5.8B
    • 7.0B
    • 12.8B
    • 70B
  • AI Task
    • 문서 생성
    • 문서 요약
    • 문서 분류
    • 문서 검색
    • 질의응답
    • 고객사 맞춤형 AI 플랫폼

  • User Requirement
    • 고객사 비전 및 목표
    • AI 도입 목적
    • 예산 및 내부 IT 환경
    • 대상 업무 내용