ipex-llm: Intel CPU 및 GPU에서 로컬 LLM의 추론 및 미세 조정을 위한 PyTorch LLM 라이브러리
|
|
0
|
994
|
4월 12, 2024
|
Google, ARM 기반 CPU 'Axion' 발표
|
|
2
|
427
|
4월 14, 2024
|
[GN] Open-Parse: LLM을 위한 PDF 레이아웃 분할(Chunking) 도구
|
|
1
|
2405
|
4월 11, 2024
|
신경망으로 압축한 텍스트(Neurally Compressed Text)로 LLM 학습에 대한 연구 (Feat. Google DeepMind)
|
|
0
|
390
|
4월 11, 2024
|
Google, Code LLM CodeGemma 2B / 7B 모델 공개
|
|
0
|
647
|
4월 10, 2024
|
Meta, 차세대 학습 및 추론 가속기 MTIAv2 공개
|
|
0
|
503
|
4월 10, 2024
|
Ollama, 임베딩 모델 지원 시작
|
|
2
|
3322
|
4월 29, 2024
|
Cheshire-Cat: 맞춤형 AI 구축을 위한 유연하고 확장성있는 프레임워크
|
|
0
|
192
|
4월 10, 2024
|
[GN⁺] Meta, 다음 주에 Llama 3의 소형 버전 출시 예정
|
|
0
|
477
|
4월 10, 2024
|
[GN] Loki by LibrAI - 사실 여부 검증 프로세스를 자동화하는 오픈소스 도구
|
|
0
|
221
|
4월 10, 2024
|
[GN⁺] Intel, Gaudi 3 AI 가속기 출시
|
|
0
|
484
|
4월 10, 2024
|
ScreenAI: UI와 시각적 언어 이해를 위한 시각-언어 모델(feat. Google)
|
|
0
|
801
|
4월 10, 2024
|
awesome-code-ai: 개발자들을 위한, 코딩을 돕는 AI 도구들을 모으는 저장소
|
|
0
|
529
|
4월 10, 2024
|
llm.c: ML Framework 없이 순수 C/CUDA를 사용한 GPT-2 학습 코드
|
|
0
|
959
|
4월 9, 2024
|
Google, 더 빠르고 쉬운 Android 개발을 위해 Android Studio에 Gemini 1.0 Pro 도입
|
|
0
|
429
|
4월 9, 2024
|
Lightning Whisper MLX: Whisper.cpp보다 10배 빠른 Apple Silicon(M1/M2/M3 등)용 Whisper 구현체
|
|
0
|
2268
|
4월 9, 2024
|
[GN] MAD 2024 Landscape: 2024년 ML/AI/Data 업계 지도와 최신 트렌드
|
|
0
|
1540
|
4월 9, 2024
|
[2024/04/01 ~ 04/07] 이번 주의 주요 ML 논문 (Top ML Papers of the Week)
|
|
0
|
762
|
4월 7, 2024
|
Apple M2 Ultra와 MLX 프레임워크로 Command R+ QLoRA 파인튜닝 모델 실행
|
|
1
|
701
|
4월 7, 2024
|
MoD(Mixture-of-Depths): Transformer 기반 언어 모델 연산 최적화를 위한 접근법, 그리고 MoDE(MoD+MoE)
|
|
0
|
2598
|
4월 7, 2024
|
[GN⁺] Cohere의 Command R+, 비즈니스를 위해 구축된 확장 가능한 LLM
|
|
0
|
681
|
4월 7, 2024
|
[GN] Opera 브라우저, 사용자가 LLM을 다운받아 로컬로 실행하는 기능 추가
|
|
0
|
373
|
4월 7, 2024
|
Claude-3, Message API를 통한 새로운 함수 호출 기능 업데이트
|
|
0
|
370
|
4월 5, 2024
|
Text-to-Music 기업 Suno의 새로운 v3 모델 공개 & 2분짜리 음악 생성 무료 제공
|
|
0
|
387
|
4월 5, 2024
|
ReALM: 사람처럼 대화하기 위한 '참조 해석'을 언어 모델에 적용한 Apple의 연구 소개
|
|
0
|
853
|
4월 4, 2024
|
podgenai: GPT-4와 TTS를 사용한 자동 팟캐스트 생성 도구
|
|
0
|
418
|
4월 4, 2024
|
InfiniFlow의 RAGFlow, Apache 2.0 라이선스를 채택하며 오픈소스로 전환
|
|
0
|
1006
|
4월 4, 2024
|
SWE-agent: GitHub 저장소를 탐색하고 코드를 편집/실행할 수 있는 LLM 기반 AI 엔지니어 프로젝트
|
|
0
|
617
|
4월 3, 2024
|
pip-library-etl: 코드 문서화 및 SQL 쿼리 생성을 도와주는 1.3B 규모의 작은 언어 모델
|
|
0
|
307
|
4월 3, 2024
|
W&B, 한국어 LLM 리더보드 'Horangi(호랑이)' 공개
|
|
0
|
1149
|
4월 2, 2024
|