[230110] : 모두의연구소가 제공하는 오늘의 인공지능 소식

eunsoo · 1월 10, 2023, 11:00오전

오늘의 인공지능 소식~!! 시작합니다.

현시점 인공지능 세계에서는 다양한 LLM 모델이 연구개발되고 있습니다. LLM(Large Language Models)의 데이터, 논문, 파라미터 수, 공개여부 등의 정보를 정리한 엑셀시트를 공유드립니다.
작성자 : @debarghya_das, 엑셀시트 , 트위터원문
요즘 ChatGPT가 아주 핫한데요. ChatGPT로 코딩하기, ChatGPT와 Midjourney로 그림 그리기 등 ChatGPT와 관련된 자료들을 모아놓은 곳이 있어 공유드립니다 : Best ChatGPT Resources 101
어떠한 질문에도 자연스럽게 답변을 내놓는 ChatGPT. 놀라우면서도, 그 내용을 잘 들여다보면 사실은 틀린 경우가 많이 있습니다. 어떻게 하면 “정답”이 있는 질문에 대해서도 정확하게 답변할 수 있을까요? 지식 연산 검색엔진인 울프럼 알파(WolframAlpha)는 chatGPT와 Wolfram|Alpha의 결합을 통해 가능할 것이라고 이야기합니다. chatGPT의 다채로운 문장생성능력과 Wolfram|Alpha의 정확한 지식검색능력을 결합하는 것인데요. 더 나아가 Wolfram 언어를 배우는 chatGPT에 대한 연구개발도 진행중이라고 합니다 : Wolfram|Alpha as the Way to Bring Computational Knowledge Superpowers to ChatGPT
오픈AI가 개발한 Text to Image 모델인 DALL-E의 사촌격으로 MS에서 개발한 Text to Speech 모델인 VALL-E 의 데모와 논문 공유드립니다. : Demo page,
Neural Codec Language Models are Zero-Shot Text to Speech Synthesizers

오늘의 AI소식에 대한 피드백은 언제나 환영입니다 !
앞으로도 꾸준히 좋은 소식을 전달해 드리기 위해 노력하겠습니다.
감사합니다.

9bow · 1월 10, 2023, 3:12오후

GeekNews에 @eunsoo 님께서 소개해주신 Vall-E 모델에 대한 한국어 소개(!)를 해주신 것이 있어 퍼왔습니다.

[소개 글]

트랜스포머 기반의 Text-to-Speech 모델
어떤 음성이든 3초만 있으면 그 음성으로 합성 가능
최신 Zero-shot TTS들보다 훨씬 자연스럽고 화자와 유사하며, 화자의 감정 및 음향 환경도 보존
예전 파이프라인은 phoneme(음소) → mel-spectrogram → waveform 였는데,
VALL-E는 phoneme → discrete code → waveform
다양한 음성 합성 어플리케이션 및 GPT-3 같은 AI 모델과 결합 가능

[출처]

출처 덧글로 xguru님께서 올려주신, 함께 읽으시면 좋을만한 링크들도 아래 함께 공유합니다.