주요 뉴스 & 신규 출시 소식 / Headlines & Launches
Dell, 생성형 AI에 올인 / Dell is all in on generative AI (3 minute read)
Dell은 고성능 하드웨어와 관리형 서비스 플랫폼을 갖춘 새로운 제품인 Dell Generative AI 솔루션으로 생성형 AI에 뛰어들고 있습니다. Dell은 엔비디아와의 파트너십을 통해 AI 모델 실행을 가속화하고 사용자의 AI 실험 및 문제 해결을 지원하는 것을 목표로 하고 있습니다.
Dell is venturing into generative AI with its new offering, Dell Generative AI Solutions, which features high-performance hardware and a managed services platform. Through a partnership with Nvidia, Dell aims to accelerate AI model execution and aid users in AI experimentation and troubleshooting.
인텔, 모든 플랫폼에 AI를 구축할 계획 / Intel plans to build AI into every platform (3 minute read)
인텔 CEO인 팻 겔싱어는 2023년 2분기 실적 발표에서 향후 모든 인텔 제품에 AI를 통합할 계획을 발표했습니다. 곧 출시될 메테오 레이크 칩을 시작으로 인텔의 소비자급 프로세서에는 머신러닝 작업을 위한 신경 처리 기능이 내장될 예정입니다. 겔싱어는 클라우드 서비스에 의존하지 않고 클라이언트 측에서 로컬로 작동하는 AI의 필요성을 강조하며 인텔의 전략적 초점 전환을 알렸습니다.
Intel CEO, Pat Gelsinger, announced plans to integrate AI into all future Intel products during the company's Q2 2023 earnings call. Starting with the upcoming Meteor Lake chip, Intel's consumer-grade processors will feature built-in neural processing for machine learning tasks. Gelsinger emphasized the need for AI to operate locally, on the client side, rather than relying on cloud services, signaling a shift in Intel's strategic focus.
32K 컨텍스트 시대 준비하기 / Preparing for the era of 32K context (12 minute read)
Together AI는 다중 문서 이해, 요약 및 질문 답변과 같은 향상된 긴 컨텍스트 작업을 위해 위치 보간 및 시스템 최적화를 사용하는 고급 모델인 LLaMA-2-7B-32K를 출시했습니다. 이 모델은 더 빠른 추론 및 미세 조정 속도를 제공하며 32K 컨텍스트를 효율적으로 처리할 수 있도록 업데이트된 소프트웨어 스택이 함께 제공됩니다. 사용자는 api.together.ai, OpenChatKit 또는 HuggingFace에서 사용해 볼 수 있습니다.
Together AI has released LLaMA-2-7B-32K, an advanced model that uses Position Interpolation and system optimizations for enhanced long-context tasks such as multi-document understanding, summarization, and question answering. The model brings faster inference and fine-tuning speeds and comes with an updated software stack for efficient processing with 32K context. Users can try it at api.together.ai, OpenChatKit, or HuggingFace.
연구 & 혁신 관련 소식 / Research & Innovation
Ollama (GitHub Repo)
대규모 언어 모델을 실행, 생성, 공유할 수 있습니다.
Run, create, and share large language models.
FacTool (GitHub Repo)
FacTool은 대규모 언어 모델에서 생성된 텍스트의 사실 오류를 감지하기 위한 도구 증강 프레임워크입니다.
FacTool is a tool augmented framework for detecting factual errors of texts generated by large language models.
ScaleVLN: 대규모 데이터 생성을 위한 새로운 접근법 / A New Approach for Large-Scale Data Generation (GitHub Repo)
이 연구는 시각적 내비게이션을 위한 AI 에이전트 학습을 위해 방대하고 다양한 데이터셋을 생성하는 패러다임을 제안합니다.
This research proposes a paradigm for creating massive, diverse data sets to train AI agents for visual navigation.
엔지니어링 및 리소스 관련 소식 / Engineering & Resources
GPT-3.5가 라마 2보다 저렴할 때 / When GPT-3.5 is cheaper than Llama 2 (8 minute read)
트레이닝 처리량, 프롬프트 처리량, 생성 처리량은 모두 다른 비용을 가지며 다른 컴퓨팅 리소스에 의해 병목 현상이 발생합니다. 이 때문에 특정 워크로드는 실제로 GPT-3.5를 사용하는 것보다 Llama 70B를 사용하는 것이 더 비쌉니다. 이 블로그는 우아하게 작성되었으며 모델 배포 고려 사항에 대한 훌륭한 엔지니어링 정보를 담고 있습니다.
Training throughput, prompt processing throughput, and generating throughput all have different costs and are bottlenecked by different computational resources. Due to this, certain workloads are actually more expensive on Llama 70B than paying for GPT-3.5. This blog is elegantly written and has some really great engineering tidbits around model deployment considerations.
TrafficSafetyGPT: LLM을 통한 교통 안전 개선 / Improving Transportation Safety with Large Language Models (20 minute read)
LLM은 수많은 자연어 처리 작업에서 성공을 거두었지만, 교통 안전 분야에서는 전문 지식이 필요하기 때문에 부족합니다. 이 연구는 고유한 데이터셋을 사용하여 미세 조정된 LLM 기반 모델인 TrafficSafetyGPT를 개발하여 이 문제를 해결합니다.
Despite the success of LLMs in numerous natural language processing tasks, they fall short in the transportation safety sector due to the need for specialized knowledge. This research addresses this by developing TrafficSafetyGPT, an LLM-based model fine-tuned using a unique dataset.
새로운 알고리즘으로 멀티태스크 학습의 균형 맞추기 / Balancing Multi-Task Learning with a New Algorithms (14 minute read)
멀티태스크 학습에서는 작업 간의 균형이 매우 중요합니다. 이 논문에서는 작업 가중치를 동적으로 조정하여 성능을 개선하는 두 가지 혁신적인 개선 가능한 갭 밸런싱 알고리즘을 제안합니다.
In multi-task learning, the balance between tasks is crucial. This paper proposes two innovative improvable gap balancing algorithms that dynamically adjust task weights to improve performance.
그 외 소식 / Miscellaneous
Amazon, "가장 야심찬" 인공지능 모델 개발을 위한 팀 구성 / Amazon Formed A Team To Work On Its “Most Ambitious” AI Models (5 minute read)
아마존의 CEO 앤디 재시(Andy Jassy)는 이제 아마존의 가장 야심찬 인공지능 프로젝트를 연구하는 새로운 그룹을 직접 감독하게 되었습니다.
Amazon CEO Andy Jassy now has direct oversight of a new group that's working on the company's most ambitious artificial intelligence project.
TechCrunch Discrupt 2023 행사에서 AI 스테이지 아젠다 발표 / Announcing the AI Stage agenda at TechCrunch Disrupt 2023 (5 minute read)
TechCrunch Discrupt 2023은 하루 동안 AI에 전념할 예정입니다. 이 행사에서는 업계 리더와 전문가들이 구글의 딥마인드 프로젝트, AI의 윤리적 과제, 생성형 AI, 수십억 달러 규모의 AI 가치 평가, 허위 정보와 창의성에서 AI의 역할 등의 주제에 대해 논의할 예정입니다. 9월 19일부터 21일까지 샌프란시스코에서 열리는 컨퍼런스에 대한 최신 소식을 놓치지 마세요.
TechCrunch Disrupt 2023 will dedicate a day to AI. It will feature industry leaders and experts discussing topics like Google's DeepMind projects, AI's ethical challenges, generative AI, billion-dollar AI valuations, and AI's role in disinformation and creativity. Stay updated with the evolving agenda as the conference unfolds on September 19-21 in San Francisco.
더 읽어보기 / Quick Links
Aistro (Product Launch)
아이스트로는 고대 점성술의 지혜와 현대의 대규모 언어 모델 AI의 힘을 결합한 앱입니다! 아이스트로 앱을 사용하면 운세, 성격 또는 미래에 대한 모든 질문을 할 수 있습니다. 생년월일, 시간, 위치를 기반으로 개인화된 운세 정보를 받아보세요.
Aistro brings together the wisdom of ancient Astrology with the power of modern large language model AI! Aistro app lets you ask any question about your horoscope, personality, or future. Get personalized readings based on your birth date, time, and location.
Musicfy (Product)
뮤직파이를 사용하면 원하는 미학에 일관성을 유지하면서 원하는 예술적 스타일로 손쉽게 변환하여 노래 또는 말하기 능력을 향상시킬 수 있습니다.
Musicfy allows people to enhance your voice's singing or speaking capabilities by effortlessly transforming it into the artistic style of your preference, all while ensuring consistency with the desired aesthetic.
Rust Llama (GitHub Repo)
Rust용으로 만든 llama2.c의 복제본입니다 - 왜 만들었을까요? 학습용으로 만든 것 같긴 하지만, 메모리-안전 때문에 만든걸까요?
A replication of llama2.c, but in Rust! Why? Mostly to learn, but also maybe memory safety?