(오늘의 짤방: Generative AI is made possible by a mountain of Open Source! Let's not forget that. via @teoliphant)
- 빅데이터/인공지능
- Multimodal-Maestro gives you more control over large multimodal models to get the outputs you want.
- Recap of AWS re:Invent 2023
- Changelog - Keep track of changes to the OpenAI API.
- Excalidraw now supports AI-powered: 1. Text-to-diagram 2. Wireframe-to-code
- Information Retrieval: Who wins, GPT-4-Turbo or a RAG based on GPT4?
- Unsupervised speech-to-speech translation from monolingual data
- 🦜🔗 LangChain Templates
- Parsing tables in PDFs is a super important RAG use case. We found that using the recent Table Transformer model (@deepsmock) combined with GPT-4V gives you superpowers 💪(노트북)
- 🚀 Introduce UniIR, a unified instruction-guided multimodal retriever handles diverse tasks.
- 5 open-access video generation models 📹
- 시험세션에 얼마나 잘 푸는지 비교해본 결과 "먼저 시도하고, 전략적 프롬프트의 해설 제공" 그룹 효과가 가장 좋다는 #논문
- GN⁺: Animate Anyone: 캐릭터 애니메이션을 위한 이미지-to-비디오 합성 기술 (humanaigc.github.io)
- KB국민은행은 왜 이토록 AI를 중요하게 생각하는 것일까?
- 가트너, 소프트웨어 엔지니어링 하이프 사이클 발표…“AI와 플랫폼 엔지니어링 주류화”
- 이파피루스, 오픈AI ‘챗GPT’에 PDF 문서 처리 기술 공급
- 노키아, 인간의 음성으로 네트워크 재구성하는 인공지능 기술 공개
- Unlocking the potential of AI marketing in 2023
- 누구에게도 도움이 되지 않는 AI 과대광고
- “나만의 코파일럿 만드는 가장 빠른 툴” 애저 AI 스튜디오 사용법
- 마이크로소프트가 ‘빙챗’을 포기한 이유
- 엘루서 AI, 수학 특화 LLM '레마' 출시..."수학 넘어 LLM 발전에 도움될 것"
- 거기 말고 이 호텔 어때? - 호텔 서비스 추천 시스템 도입기
- 상업용 LLM이 넘어야 할 3가지 큰 산
- Lessons from Building CodeBuddy: A Contextualized AI Coding Assistant
- LLM-Assisted Code Cleaning For Training Accurate Code Generators
- It's official: Sam Altman just confirmed the new Q* model breakthrough was a leak.
- SEINE: Image-to-Video generation
- ‘개발자들, 보안 우회까지 해가며 AI 도구 사용’… 스닉 조사 결과
- LaVie: Text-to-Video generation
- 글로벌 생성AI 플랫폼에 첫 토종 LLM…AWS, LG AI연구원과 맞손
- AWS, 이미지 생성형 AI 레이스 가세...B2B 사업 초점
- AWS도 ‘멀티모달 AI’ 참전…이미지나 음성까지 인식·생성
- Introducing DBSCAN, a Density based clustering algorithm. 🚀
- 여러 가지 AI 기술을 수집해서 정리하고 있는 문서(영어)
- Machine Learning Collection
- Open-Source LLMs vs. ChatGPT:
- Demo: table detection & recognition with Table Transformer (TATR).
- Some intuitions about LLM
- Reference architecture for a real-time ad performance analytics platform
- SDXL Turbo - 실시간 텍스트-to-이미지 생성 모델 (stability.ai)
- Multimodal-Maestro gives you more control over large multimodal models to get the outputs you want.
- The Power of Prompting - the power of prompting strategies that demonstrates how the generalist GPT-4 model can perform as a specialist on medical challenge problem benchmarks.
- 💥 OpenAI Proxy Server - LiteLLM Server manages Calling 100+ LLMs Huggingface/Bedrock/TogetherAI/etc. in the OpenAI ChatCompletions & Completions format
- ChatGPT에 텍스트 검색을 통합하는 RAG와 벡터 데이터 베이스 Pinecone #8 임베딩 API 비교
- The HNSW (Hierarchical Navigable Small World) indexing algorithm allows for efficient nearest neighbor search in vector databases.
- GN⁺: 인간을 위한 딥러닝, Keras 3.0 릴리즈 (keras.io)
- OpenAI now has a new cookbook for developers to get started.
- SparseCtrl: Adding Sparse Controls to Text-to-Video Diffusion Models
- DiffusionMat: Alpha Matting as Sequential Refinement Learning
- Extracting Training Data from ChatGPT
- Building an LLM Application for Document Q&A Using Chainlit, Qdrant and Zephyr
- Local Explanations for Deep Learning Models (Fall 2023)
- 데이터의 흐름을 보여주는 시각화, 생키(sankey) 다이어그램
- 고군분투 LLM 프로덕트 적용기: Blind Prompting 부터 Agent까지
- B급동료에 열받느니 너랑 일할래…1인 기업 ‘생산혁명’ 불붙인 AI
- "150명 직원 절반 줄어도 매출 쑥"… 단순업무는 이미 AI가 팀장
- Adobe, 텍스트-투-비디오 AI 플랫폼 Rephrase 인수 (venturebeat.com)
- GPT Researcher is an autonomous agent designed for comprehensive online research on a variety of tasks.
- Carton - 다양한 언어에서 ML모델을 하나의 API로 실행하기 (carton.run)
- Knowledge Bases now delivers fully managed RAG experience in Amazon Bedrock
- Amazon Bedrock Retrieval-Augmented Generation (RAG) Workshop
- [AWS 리인벤트 2023]챗GPT 대항마…AI기반 챗봇 '아마존 Q' 출격
- TchAIkovsky - Using JAX + Equinox to generate expressive piano performances in a MIDI format.
- With multi-modal + LLM capabilities, we show you how to turn any product webpage into a structured API ⚡️
- GPT-4’s potential in shaping the future of radiology
- Soul Machines™ unites cutting-edge AI technology with unparalleled animation artistry to create the world’s most alive Digital People™.
- Everything About Tokenization
- This notebook walks through using the FuzzyCitationEnginePack, which can wrap any existing query engine and post-process the response object to include direct sentence citations, identified using fuzzy-matching.
- Tabby is a self-hosted AI coding assistant, offering an open-source and on-premises alternative to GitHub Copilot.
- “앞으로 세상은 AI 쓰는 자, 못 쓰는 자로 갈려”
- 표 데이터 기반 문장 생성
- NeumAI - 오픈소스 대규모 RAG 프레임워크 (github.com/NeumTry)
- 숨겨진 효소 쏙쏙 찾아내는 인공지능 개발
- GN⁺: VectorDB - Kagi Search가 개발한 벡터 데이터베이스 (vectordb.com)
- MeshGPT: Generating Triangle Meshes with Decoder-Only Transformers
- 오픈AI 패권 다툼의 승자와 패자
- 🚀 @huggingface Model Memory Calculator 🚀
- 유럽 기업들 "AI 규제보다 지원을" EU AI 법안 우려 성명 발표
- RAG 101 for Enterprise 🔎🧑💼
- Bard can now watch YouTube videos for you
- Using llama.cpp with AWS instances
- Self-RAG: Learning to Retrieve, Generate and Critique through Self-Reflections
- RAG: How to Talk to Your Data - Comprehensive guide on how to analyse customer feedback using ChatGPT
- Drawing is the new coding. @tldraw turns doodles into code. 10 wild examples:
- 의료인공지능 기술 '봇물'…활용성 저하 AI '신뢰도'
- RustGPT - Rust+Htmx+SQLite로 만든 ChatGPT UI (github.com/bitswired)
- ‘측정 기준 구체화’로 생성형AI 도입 효과를 높이다··· 크리스 베디 서비스나우 CIO
- Multi-modal retrieval (image + text) for RAG applications with @llama_index and @neo4j.
- Open Interpreter - OpenAI 의 Code Interpreter와 같은 기능을 로컬에서 오픈소스로 실행하기 (github.com/KillianLucas)
- "생성형 AI 눈부신 성장…비즈니스 사용례는 그에 못 미쳐" 오라일리 보고서
- GPQA: A Graduate-Level Google-Proof Q&A Benchmark
- 상용 수준의 LLM 애플리케이션을 위한 개발자 가이드 (번역 글) (discuss.pytorch.kr)
- [1hr Talk] Intro to Large Language Models by Andrej Karpathy
- AI 마케팅 2024: 핵심 트렌드와 도구들 (foundationinc.co)
- 스노우플레이크, AI/ML 지식 없이 LLM 앱 구축할 수 있는 ‘스노우플레이크 코텍스’ 공개
- "생성형 AI의 기반" 대규모 언어 모델 총정리
- GPT-4 Vision now exists in the browser 👀
- "생성형 AI, 마침내 워크플로우에 녹아들었다"··· 서비스나우, 벤쿠버 릴리즈 공개
- 아마존, 알렉사 부서 수백 명 해고… ‘생성형 AI에 집중’
- 구글 Bard Extensions (bard.google.com)
- 엔비디아, 드롭박스와 협업 발표… “AI 기반으로 제품 경험 향상”
- 애피어, ‘AI로 마케팅 효율 높이는 다섯 가지 전략’ 발표
- GN⁺: LM Studio - LLM을 로컬에서 쉽게 실행하게 해주는 도구 (lmstudio.ai)
- Intel® Extension for Transformers - An Innovative Transformer-based Toolkit to Accelerate GenAI/LLM Everywhere
- Multi-Modal AI is rapidly taking over 🔥🚀
- How to Build a RAG-Powered Chatbot with Chat, Embed, and Rerank
- stability-ai / stable-video-diffusion - SVD is a research-only image to video model
- Stable Video Diffusion: Google Colab Free Tier Tutorial 🔥
- DiffSeg is an unsupervised zero-shot segmentation method using attention information from a stable-diffusion model.
- Stable Video Diffusion running on my RTX-4090.
- AI 스타트업 유감
- GN⁺: OpenAI, ChatGPT with Voice를 모든 무료 사용자에게 공개 (twitter.com/OpenAI)
- ShareGPT4V: Improving Large Multi-Modal Models with Better Captions
- Insanely Fast Whisper - An opinionated CLI to transcribe Audio files w/ Whisper on-device! Powered by 🤗 Transformers, Optimum & flash-attn
- Insanely fast whisper now on Mac 🚀
- Microsoft, Generative AI for Beginners 강의 공개 (microsoft.github.io)
- 스노우플레이크, AI/ML 지식 없이 LLM 앱 구축할 수 있는 ‘스노우플레이크 코텍스’ 공개
- GN⁺: Cruise 공동 창업자이자 CEO인 Kyle Vogt 해임 (techcrunch.com)
- 인공지능: 다가오는 혁명(AI: the coming revolution) 보고서 (coatue.com)
- cleanlab helps you clean data and labels by automatically detecting issues in a ML dataset.
- Stable Video Diffusion (SVD) Image-to-Video is a diffusion model that takes in a still image as a conditioning frame, and generates a video from it.
- "오늘 하루를 그려줘 - AI 그림 일기" 개발후기 (blog.devstory.co.kr)
- Shipping your Retrieval-Augmented Generation app to production with create-llama
- Neural Networks: Zero to Hero by Andrej Karpathy
- LQ-LoRA: Low-rank Plus Quantized Matrix Decomposition for Efficient Language Model Finetuning
- Open Whisper-style Speech Model (OWSM) 🔉
- The Stable Video Diffusion model just dropped 🔥
- ML News of the day🚨: Microsoft releases Orca 2, SEINE - Video Diffusion Model, System 2 Attention (S2A), Video LlaVA
- Run a medical chatbot on CPUs, no GPUs required.
- ⭐️ GPT-crawler template ⭐️
- Introducing Claude 2.1
- I’m excited to introduce RAGs - create a “ChatGPT over your data” purely with natural language 💬
- "진정한 변곡점이었다"··· 챗GPT 1주년 진단
- Can you melt eggs? Quora’s AI says “yes,” and Google is sharing the result
- Translating Latin demonology manuals with GPT-4 and Claude
- PyTorch Installation for ROCm
- Towards Monosemanticity: Decomposing Language Models With Dictionary Learning
- Decomposing Language Models Into Understandable Components
- Replit Code v1.5 is a 3.3B parameter Causal Language Model focused on Code Completion.
- Multi-modal prompt injection image attacks against GPT-4V
- A New Prompt Engineering Technique Has Been Introduced Called Step-Back Prompting
- Introducing The Foundation Model Transparency Index
- AI와 노동시장 변화
- Polystores: The Data Management Game Changer
- GN⁺: Krita AI Diffusion - 오픈소스 페인팅 도구 Krita를 위한 Generative AI
- The 14 most important data science skills (To get a $50,000 increase in salary)
- Orca 2: Teaching Small Language Models How to Reason
- LLMs cannot find reasoning errors, but can correct them!
- Text-to-Sticker: Style Tailoring Latent Diffusion Models for Human Expression
- screenshot-to-code - This simple app converts a screenshot to code (HTML/Tailwind CSS, or React or Vue or Bootstrap). It uses GPT-4 Vision to generate the code and DALL-E 3 to generate similar-looking images.
- Video-LLaVA: Learning United Visual Representation by Alignment Before Projection(깃헙)
- Intel® Neural Compressor - An open-source Python library supporting popular model compression techniques on all mainstream deep learning frameworks (TensorFlow, PyTorch, ONNX Runtime, and MXNet)
- Meta, 비디오 합성 및 편집용 AI 모델 Emu Video/Edit 공개 (ai.meta.com)
- 오픈AI는 어디로 가나
- [파워금융人]⑥ 김선우 우리은행 AI사업부장 “생성형 AI 활용한 PB 곧 나온다… 재무관리도 AI가 척척”
- "서버 안 거쳐 더 빠르다"…삼성도 출사표 던진 '온 디바이스 AI' [정지은의 산업노트]
- '하이퍼클로바X' 순항… 네이버의 AI 사업 계획은
- Training machine models locally is limited to the computation power of your computer. Here are 6 alternatives for training ML models that will give you more computational resources, including GPUs for FREE:
- Practical Tips for Finetuning LLMs Using LoRA (Low-Rank Adaptation)
- Video-LLaVA: Learning United Visual Representation by Alignment Before Projection
- Show GN: 간단한 ChatGPT 사진 번역기 (chat.openai.com)
- Interested in having free GPT-4 Turbo for @PostgreSQL topics?
- xAI Introduces Large Language Model Grok
- AI is about to completely change how you use computers
- GN⁺: 3억 3천만 달러 예산을 가진 'Kyutai AI' 연구소, 모든 것을 오픈 소스로 공개 예정 (techcrunch.com)
- Cleaning your data before building your Time Series model is crucial. Learn how to do it, step by step 🧵👇
- 투자자는 AI 스타트업을 어떻게 분류할까? (medium.com)
- GN⁺: Frigate - 실시간 AI 객체 감지 기능을 탑재한 오픈소스 네트워크 비디오 레코더 (frigate.video)
- Create professional GPTs with 1 prompt.
- 콴다는 LLM을 어떻게 활용할 수 있을까? — 2편
- GPT Crawler - 나만의 GPT를 만들기 위한 웹사이트 크롤러 (github.com/BuilderIO)
- I ❤️ multi-modal - it has significant positive implications for existing applications like doc processing/QA, education, and HCI.
- Turbocharging Llama 2 70B with NVIDIA H100
- Using GPT4V to understand risks of unique corporate structures.
- Screenshot-To-Code - GPT-4V로 화면 캡쳐를 코드로 변환하기 (github.com/abi)
- A Coder Considers the Waning Days of the Craft
- 누가 누구의 '역린'을 건드렸나? 샘 알트만 vs 오픈AI
- LlamaIndex + pptx-api (@perplexity_ai) Perplexity has an API offering a one-stop shop for you to access open-source LLMs, and it’s really fast ⚡️
- If you’re building RAG, you know about text embeddings, but what about image embeddings? 🖼️
- ⛓️ Can step-by-step prompting improve GPT-4V ❓
- Grounded Intuition of GPT-Vision’s Abilities with Scientific Images
- GPT-4 Turbo with Vision on Azure OpenAI Service
- 하드웨어
- 칩 개발 관행으로 본 애플 실리콘의 현재와 미래
- Nvidia sold half a million H100 AI GPUs in Q3 thanks to Meta, Facebook — lead times stretch up to 52 weeks: Report
- M3 칩의 CPU 코어는 무엇이 달라졌나? (eclecticlight.co)
- Microsoft Debuts Custom Chips for Cloud and AI: Azure Maia AI Accelerator and Azure Cobalt CPU
- 테슬라, 오리지널 Roadster 의 모든 디자인과 엔지니어링을 오픈소스로 공개 (teslarati.com)
- 해피 해킹 키보드 스튜디오 리뷰 | “측면 문질러 영상 전후 이동” 독특한 기능의 세련된 조합
- iPhone 15 hugely popular in South Korea – while Japanese buyers seek out used iPhone 13 minis
- OpenAI Launches GPTs to Enable Creating No-Code, Custom Versions of ChatGPT
- looking for OpenAI-4V alternatives?
- Introducing Stable Video Diffusion
- “프로세서 발열, 앞으로 더 심화될 수도” AMD
- 구글 딥마인드, AI 기반 음악 창작 도구 공개
- New collection of Jupyter Notebooks enables programmatic access to cloud-hosted USGS 3D Elevation Program (3DEP) lidar data(깃헙)
- How AMD May Get Across the CUDA Moat
- [애플 쇼크웨이브](39)엔비디아, 이러려고 ARM 사려했나
- Useful learning over the weekend – the RTX4090 is a beast. If you can get your model to fit in memory, it is almost as fast as an H100 SXM under low load⚡️
- I hacked the Magic Mouse
- 곤충 지능으로 청소 싹싹…180달러 로봇청소기, AI 강박을 깨다
- 읽을거리
- 2024년 및 중기 경제전망 by 구회예산정책처
- Emailspiration - 잘 디자인된 이메일 모음 (audienceful.com)
- [2023 한국인이 사랑한 모바일앱 200] 쿠팡·당근 위협하는 게임체인저 ‘올웨이즈’
- 40초면 敵 제압하는 근접전의 명수, 경량 전투기 F-16도 개발
- “나혼자 (잘)산다, 연예인이나 그렇지”…월 155만원 버는 1인가구 현실
- “줌 피로는 현실” 오스트리아 연구팀, 뇌 스캔 영상으로 증명
- 30대 초반 56% 미혼, 30년 뒤 청년 반토막...인구절벽 문턱 왔다
- 中알리익스프레스, 한국에 물류센터 유력…쿠팡 독주 '위협'
- 영화 [아메리칸 셰프], SNS에서 당신의 무례함은 당연하지 않습니다
- GN⁺: NVIDIA, 영업 비밀 도용으로 피소: 화면 공유중 경쟁사 코드가 노출 (engadget.com)
- 두 사람의 인터내셔널
- 박정희가 키운 하나회의 쿠데타, 왜 진압 못했나
- [유머] 전설의 중식요리 교수님 만화.manga
- 노후에 필요한 돈 최소 251만원…조달 가능 자금은 212만원 그쳐
- [뒷북경제]뚜렷해진 소득 양극화 …'계층이동 사다리' 격차는 더 커졌다
- Awesome Engineering Games (github.com/arcataroger)
- "빚내서 부동산에 투자하면…" 소득 불평등 이유 있었다 [강진규의 데이터너머]
- Max Richter- Sleep (full album)
- How Starbucks Lost the Top Spot in China’s Coffee Race
- ‘공유경제’ 탈 쓴 위워크 위기… 업계 ‘종말’ 아닌 ‘성장통’[글로벌 포커스]
(보너스: Recurrent gathered thousands of data points from 10,000 EVs to analyze how freezing temperatures affected their driving range. via @SawyerMerritt)
EOB
댓글 없음:
댓글 쓰기