AIlice
AIlice 는 완전 자율적이고 범용 AI 에이전트입니다.

GitHub / Quick Start / Demo / Development / X / Reddit
Ailice는 완전 자율적이고 범용 AI 에이전트입니다. 이 프로젝트는 오픈소스 LLM을 기반으로 JARVIS와 유사한 독립적인 인공지능 비서를 만드는 것을 목표로 합니다. AIlice는 대형 언어 모델(LLM)을 핵심 프로세서로 사용하는 "텍스트 컴퓨터"를 구축함으로써 이 목표를 달성합니다. 현재 AIlice는 주제 연구, 코딩, 시스템 관리, 문헌 검토, 그리고 이러한 기본 기능 이상의 복잡한 혼합 작업을 포함한 다양한 작업에서 뛰어난 성과를 보이고 있습니다.
AIlice는 GPT-4를 사용해 일상적인 작업에서 거의 완벽한 성능을 달성했으며, 최신 오픈소스 모델을 활용해 실질적인 적용을 향해 나아가고 있습니다.
우리는 궁극적으로 AI 에이전트의 자가 진화를 달성할 것입니다. 즉, AI 에이전트가 스스로 기능 확장과 새로운 유형의 에이전트를 구축하며, LLM의 지식과 추론 능력을 실세계에 매끄럽게 반영할 것입니다.
기능
AIlice의 주요 기술적 기능은 다음과 같습니다:
전문 주제에 대한 심층 연구 능력.
기사 및 학술 자료를 읽고 분석하는 능력.
프로그래밍 및 스크립트 실행에서 고급 자동화 제공, 종합적인 코더 및 AI 기반 운영 체제와 유사한 효율적인 시스템 관리 도구 역할.
음성 상호작용 지원.
오픈소스 모델과의 호환성 및 GPT-4와 같은 상업 모델과의 원활한 통합.
사용자 상호작용에 대한 더 직관적이고 유연한 접근, 에이전트로서 매끄러운 대화 참여 가능성 또는 작업 실행 중 개입 가능성 제공.
멀티모달 모델 지원.
자연스럽고 높은 내결함성을 갖춘 Interactive Agents Call Tree(IACT) 아키텍처.
LLM 출력의 유연한 파싱, 더 넓은 범위의 함수 호출 메커니즘 활성화.
환경과의 상호작용을 위한 모듈을 자가 구축하고 동적으로 로드하는 능력, 기능 확장의 무한한 가능성 제공.
미래 개발 로드맵
Ailice의 기본 과제는 두 가지입니다: 하나는 텍스트 기반 LLM의 기능을 실세계에 완전히 풀어내는 것이고, 다른 하나는 장기 메모리와 방대한 텍스트에 대한 일관된 이해를 위한 더 나은 메커니즘을 탐구하는 것입니다. 우리의 개발 노력은 이 두 초점 주위로 이루어집니다. Ailice 개발 자체에 관심이 있다면 다음 방향을 고려할 수 있습니다:
개선된 장기 메모리 메커니즘 탐구: 각 에이전트의 능력을 향상시키기 위해 더 나은 장기 메모리 메커니즘을 탐구해야 합니다. 대량 콘텐츠에 대한 일관된 이해와 연관성을 촉진할 수 있는 메모리 메커니즘이 필요합니다. 현재 가장 실행 가능한 옵션은 벡터 데이터베이스를 지식 그래프로 대체하는 것으로, 이는 긴 텍스트/코드 이해에 크게 기여하며 진정한 개인 AI 비서를 구축할 수 있게 합니다.
멀티모달 지원: 멀티모달 모델 지원은 완료되었으며, 현재 개발 초점은 주변 모듈의 멀티모달 지원으로 이동하고 있습니다. 스크린샷을 기반으로 컴퓨터를 조작하고 마우스/키보드 동작을 시뮬레이션하는 모듈이 필요합니다.
자가 확장 지원: 언어 모델이 스스로 코딩하고 새로운 주변 모듈/에이전트 유형을 구현하며 동적으로 로드해 즉시 사용할 수 있도록 하는 것이 목표입니다. 이 능력은 자가 확장을 가능하게 하여 시스템이 새로운 기능을 매끄럽게 통합할 수 있게 합니다. 기능의 대부분은 완료되었으나, 새로운 유형의 에이전트 구축 능력이 아직 개발 중입니다.
더 풍부한 UI 인터페이스: 대화 창에서 에이전트 출력을 트리 구조로 정리하고 모든 에이전트의 출력을 동적으로 업데이트해야 합니다. 웹 인터페이스에서 사용자 입력을 받아 스크립터의 표준 입력으로 전달하는 기능이 특히 sudo 사용 시 필요합니다.
현재 프레임워크 기반으로 다양한 기능의 에이전트 개발.
복잡한 작업에 IACT 아키텍처 적용 탐구: Interactive Agents Call Tree를 활용하면 대형 문서를 분해해 읽기 이해도를 높이고, 복잡한 소프트웨어 엔지니어링 작업을 더 작은 모듈로 분해해 반복을 통해 전체 프로젝트 빌드와 테스트를 완료할 수 있습니다. 이는 정교한 프롬프트 설계와 테스트 노력이 필요하지만, 미래에 대한 흥미로운 약속을 담고 있습니다. IACT 아키텍처는 컨텍스트 창의 자원 제약을 크게 완화하며, 더 복잡한 작업에 동적으로 적응할 수 있게 합니다.
자가 확장 메커니즘을 사용한 풍부한 외부 상호작용 모듈 구축!: 이는 AiliceEVO 에서 실현될 것입니다.
위에 언급된 작업 외에도, 낮은 지식 콘텐츠를 가지지만 더 높은 추론 능력을 갖춘 더 작은 LLM을 만드는 가능성을 적극적으로 고민해야 합니다.
Last updated