(오늘의 짤방: I've always had a hard time explaining to people how GPUs work. Now I just show them this. via @tunguz)
- 빅데이터/인공지능
- "고작 13억 매개변수로 GPT-4 대체"...MS, 오픈 소스 LMM 공개
- BakLLaVA 1 is a Mistral 7B base augmented with the LLaVA 1.5 architecture.
- The brand-new @Voyage_AI_ embedding model is one of the best models you should use for your RAG pipeline today (outperforms ada-002 by a big margin)
- EfficientML.ai Lecture 16 - Diffusion Model (MIT 6.5940, Fall 2023)
- Distil-Whisper - 6배 빠르고, 49% 작은 버전의 Whisper (github.com/huggingface)
- 기업에서의 LLM 활용을 위한 Palantir AIP 솔루션-팔란티어 서지숙
- E3 TTS: Easy End-to-End Diffusion-based Text to Speech
- I evaluated @awscloud Titan Embeddings on Amazon Bedrock on the MTEB and compared it to other top open-source models and @OpenAI 🧐
- Boosting RAG: Picking the Best Embedding & Reranker models(colab note
- AI is now inside Google Maps!
- rag-pinecone-rerank - This template performs RAG using Pinecone and OpenAI along with Cohere to perform re-ranking on returned documents.
- AWS, 머신러닝용 EC2 캐퍼시티 블록에 엔비디아 H100 GPU 적용
- AI 도난 방지 기술 '데이터 포이즈닝'은 윤리적인가?
- "잡음 제거 무선 이어폰으로 심박수 측정"··· 구글 리서치, 신개념 SW 기술 소개
- '실망'조차 넘어선 윈도우용 코파일럿
- 알리바바 클라우드, 10가지 산업별 AI 모델 공개
- 한국거래소, 클라우드 기반 '미가공 데이터' 판매 사업 추진
- 한국도 'AI 족쇄 채우기' 서두른다…정부가 편향성 직접 검증 [팩플]
- 빨라지는 통신3사 AI 시계 "속도전 돌입"
- Gboard for Android getting a ‘Scan Text’ OCR tool [Gallery]
- “생성형 AI, 스마트폰까지 침투했다”…내년 모바일 시장 키워드는 ‘AI’
- The architecture of today’s LLM applications
- 한국오라클 “데이터 관리 트렌드는 생성형 AI 기반 ‘자동화’로 흐른다”
- Auto ⚡ ProPainter 🧑🎨 - This is a demo for automatic removal of objects from videos using Segment Anything Model, MetaCLIP, and ProPainter combo.
- Accelerating Inference on x86-64 Machines with oneDNN Graph
- Multimodal Retrieval with Text Embedding and CLIP Image Embedding for Backyard Birds(colab note)
- Large Language Models Understand and Can be Enhanced by Emotional Stimuli
- Efficient LLM Inference on CPUs(code)
- We're excited to introduce Embed v3, our latest and most advanced embeddings model. Embed v3 offers state-of-the-art performance per trusted MTEB and BEIR benchmarks.(colab note)
- ChipNeMo: Domain-Adapted LLMs for Chip Design
- clip-image-search - Fine-tuning OpenAI CLIP Model for Image Search on medical images.
- ChatCoder: Chat-based Refine Requirement Improves LLMs' Code Generation
- [독서광] 인간 vs. AI 정규표현식 문제 풀이 대결(본인이 작성한 글)
- MetNet-3: A state-of-the-art neural weather model available in Google products
- Style-Aware Radiology Report Generation with RadGraph and Few-Shot Prompting
- Genv - GPU Environment and Cluster Management
- CapsFusion: Rethinking Image-Text Data at Scale
- LLMRec: Large Language Models with Graph Augmentation for Recommendation
- AI 시대의 클라우드, 여전히 개발자를 감안할 이유
- The Generative AI Paradox: "What It Can Create, It May Not Understand"
- Open Empathic - AI에 공감과 감성 지능을 탑재하는 것을 목표로 하는 오픈소스 (laion.ai)
- AI Assistant Update – October 2023
- Big Vision - This codebase is designed for training large-scale vision models using Cloud TPU VMs or GPU machines.
- Beyond U: Making Diffusion Models Faster & Lighter
- The Rise of the AI Engineer
- I just noticed that Bing Chat AI has a great new feature unavailable on ChatGPT.
- Build an Analytics Dashboard with Python, Streamlit, and MySQL
- A 12 Lesson course teaching everything you need to know to start building Generative AI applications
- [창간 38주년 특별기획] 생성형 AI가 가져온 변화, 그리고 미래
- Does GPT-4 Pass the Turing Test?
- 생성형 AI 저작권 소송 첫 판결, “유사성 부족”으로 아티스트 패배
- 구글 맵 업데이트 - 경로에 대한 Immersive View 및 AI 기능들 추가 (blog.google)
- Data engineering at Meta: High-Level Overview of the internal tech stack
- How to implement Weaviate RAG applications with Local LLMs and Embedding models
- Biblos - Bible Exploration with Vector Search and Summarization
- Evaluate LLMs and RAG a practical example using Langchain and Hugging Face
- Multimodal ChatGPT for Medical Applications: an Experimental Study of GPT-4V
- This repository contains demos I made with the Transformers library by 🤗 HuggingFace. Currently, all of them are implemented in PyTorch.
- AI 경량화: 더 빠르고 저렴한 AI 서비스
- 인프런이 자동으로 자막을 생성하기까지 (AI/인프라 편)
- ChatGPT : Chat with Images로 이젠 본다 (사용법)
- Evan Morikawa at LeadDev West Coast 2023(scaling chatgpt)
- Embeddings: What they are and why they matter
- Learn how to build RAG from scratch with Ray embedded in every component, ensuring that all operations (parsing, chunking, metadata extraction, embedding) are distributed ⚡️
- Linear Regression implemented from scratch in Python🔥
- '고가 GPU 대신 CPU로 AI를' 인텔, 네이버와 AI 서버 구축
- Convolution 제국의 역습 (gonzoml.substack.com)
- 8-bit Float Support in H100 and RTX 40 series GPUs
- FP8-LM: Training FP8 Large Language Models
- ConfAIde: Can LLMs Keep a Secret? Testing Privacy Implications of Language Models
- Here're 17 ways Google Bard Outperforms ChatGpt 10x boost productivity & earn $$$
- CodeFusion: A Pre-trained Diffusion Model for Code Generation(Microsoft paper claims ChatGPT 3.5 has ~20 billion parameters)
- codebooga - A high-performing code instruct model created by merging two existing code models.
- Perfect CheatSheet for prompting
- 스타트업이 챗GPT로 사업하는 노하우 대방출 - 한국마이크로소프트, '마이크로소프트 스타트업 서밋 - 젠AI 로드쇼' 개최
- 임베딩(Embeddings)은 무엇이고 왜 중요한가 (simonwillison.net)
- We’re excited to feature NewsGPT (by timho102003) 📰🧠 - a production-grade news aggregator augmented with LLM capabilities.
- AI에서 창업가에게 기회가 있는 5가지 분야 (lsvp.com)
- Midjourney vs. Firefly 2 vs. DALL-E 3 (designingwithai.substack.com)
- Unstructured data management and governance using AWS AI/ML and analytics services
- Gemini is coming to Makersuite & so are Stubbs
- How vector search and semantic ranking improve your GPT prompts
- Llama-2 on Inferentia
- LLM 비교/테스트: 39개 모델 테스트(7B~70B + ChatGPT/GPT4)
- Gartner’s AI Hype Cycle is Way Passed its Due Date — And Are We Entering a Classical ML Winter?
- Have you ever wanted to inference a baby Llama 2 model in pure Mojo? No? Well, now you can!
- The 7 Best AI Image Generators in 2023 (Unbiased List)
- GN⁺: 구글, OpenAI의 라이벌 Anthropic에 최대 $2b(2.6조원)까지 투자하기로 (reuters.com)
- 요즘 핫한 커리어 스킬, ‘프롬프트 엔지니어링’ 현황과 전망
- “의료 분야 AI, 기회 주지만 의사 대체해선 안돼” 프리즈마 헬스 최고 의료 책임자 앤드류 알바노
- 프로그래밍에서 AI가 대체하지 못하는 것들
- “챗GPT로 쓴 자소서 잡아낸다”… 무하유, AI 서류 평가 솔루션 프리즘에 GPT킬러 연동
- AI 피싱도 인간에 근접… 생성형 AI 모델, 5분 만에 ‘설득력 높은’ 메일 생성
- “RTA가 더 적절한 표현, 왜냐면...” RPA 배포·실수 7가지
- "제조 분야 AI,2028년까지 연간 45.6% 고속 성장··· 빅데이터, 로봇, IoT가 견인"
- 현대 기업이 직면한 데이터 통합 과제 5가지
- ‘낙오에의 두려움, 잠재력에의 기대’··· IT 리더들의 생성형 AI 수용 이야기
- ‘AI가 주도하며 다른 트렌드에 영향 미칠 것’… 가트너의 2024년 이후 IT 시장 예측
- “노래 가사 AI 학습에 쓰려면 돈 내라”··· 음악 유통사, LLM 기업 앤트로픽 상대로 소송 진행
- 오픈AI, 비활성화했던 챗GPT 웹 브라우징 기능 정식 배포
- 시스코, LLM 넘어 'RMM'으로 AI 전략 강화... "웹엑스 AI 플랫폼서 화상회의 경험 혁신"
- 구글 클라우드, 넥슨에 ‘버텍스 AI’ 공급…“게임·커뮤니티 부적절한 콘텐츠에 막는데 AI 활용”
- The Dark Reality: People Misusing ChatGPT
- "3일만에 AI 서비스 개발 가능"··· 원티드랩, 구독형 생성 AI 개발툴 ‘원티드 LaaS’ 출시
- 조용히 확산 중인 생성형 AI에 통제력 없는 기업 ‘수두룩’
- '효과 제대로 누리려면...' API 전략을 추구할 때 따라야 할 3가지 원칙
- ‘MIT, 코히어 外’… 생성형 AI 데이터 출처 찾는 탐색기, 11개 기관 공동 제작
- 업무협약은 했는데…다음 스텝 못밟는 AI 디지털교과서 왜?
- 넥슨, 구글 클라우드와 협업…유해 이미지 탐지 AI모델 성능 고도화
- 유튜브 뮤직, 플레이리스트 커버를 AI로 생성 가능 (theverge.com)
- Generating Mermaid Syntax Diagrams with AI-powered Amazon Bedrock 🧜🏼♀️
- CodeBooga is the best code instruct I have seen, next to GPT4.
- Personal Copilot: Train Your Own Coding Assistant
- Getting started with Llama by Meta
- Fragility in AIs Using Artificial Neural Networks
- Embedding fine-tuning is underrated and underexplored.
- Annotator-Embeddings - Cleaned repo for our paper You Are What You Annotate: Towards Better Models through Annotator Representations at Findings of EMNLP 2023.
- Now add a walrus: Prompt engineering in DALL-E 3
- Looking back at wildfire research in 2023
- MATHVISTA: EVALUATING MATH REASONING IN VISUAL CONTEXTS WITH GPT-4V, BARD, AND OTHER LARGE MULTIMODAL MODELS
- TABULAR DATA: DEEP LEARNING IS NOT ALL YOU NEED
- LongLLMLingua is a research project/paper that presents a new method for prompt compression in the long-context setting.
- GN⁺: Jina AI, 세계 최초 오픈소스 8K 텍스트 임베딩 모델 공개 (jina.ai)
- There’s now a method to the madness; we’ve completely re-orged our docs to follow the user journey towards building production RAG:
- A Picture is Worth a Thousand Words: Principled Recaptioning Improves Image Generation
- PyTorch Conference 2023
- Grammar checking at Google Search scale
- I'm working on a framework (WIP) to understand Advanced Retrieval w/ a few of @LangChainAI's use cases.
- Candle BLIP Image Captioning - Rust/WASM Demo
- Big update: Meta's Long Llama beats GPT-3.5 in long contexts and goes toe-to-toe with GPT-4 in summarization.
- We did a complete survey of llama2-chat 7B, 13B, 70B models on simple-to-hard LLM tasks in LlamaIndex (top-k RAG to agents).
- LLM Collection - This section consists of a collection and summary of notable and foundational LLMs.
- Unit Scaling: Out-of-the-Box Low-Precision Training
- Jina AI Launches World's First Open-Source 8K Text Embedding, Rivaling OpenAI
- We have a brand-new cookbook on multimodal captioning + RAG 🖼️ (s/o @Haotianzh)
- jina-embeddings-v2-base-en is an English, monolingual embedding model supporting 8192 sequence length.
- EfficientML.ai Lecture 13 - Transformer and LLM (Part II) (MIT 6.5940, Fall 2023)
- 👉 An overview of machine learning model training!
- Delightful animations of tensor operations for AI
- Welcome to an open source implementation of OpenAI's CLIP (Contrastive Language-Image Pre-training).
- An Inverse Scaling Law for CLIP Training
- What everybody should know about data monetization
- Pandas Vs NumPy!!
- 유니버설 뮤직, Antrhropic의 Claude AI가 생성한 가사에 대해서 저작권 침해 소송을 제기 (ft.com)
- SAM-CLIP: Merging Vision Foundation Models towards Semantic and Spatial Understanding
- What Algorithms can Transformers Learn? A Study in Length Generalization
- Transformers from Scratch
- Segmind Stable Diffusion 1B (SSD-1B) Model Card
- Google Open-Sources AI Fine-Tuning Method Distilling Step-by-Step
- Deploy Embedding Models with Hugging Face Inference Endpoints
- Matryoshka Diffusion Models
- OpenAI’s Corporate Sales Come Under Pressure as AI Customers Eye Cheaper Options
- ALCUNA: Large Language Models Meet New Knowledge
- OpenAgents: An Open Platform for Language Agents in the Wild
- Google's new free Midjourney competitor can create personalized clothing.
- GenBench - Making state-of-the-art generalisation testing the new status-quo in NLP
- 📐 The 🤗 Open ASR Leaderboard ranks and evaluates speech recognition models on the Hugging Face Hub.
- Parsr, is a minimal-footprint document (image, pdf, docx, eml) cleaning, parsing and extraction toolchain which generates readily available, organized and usable data in JSON, Markdown (MD), CSV/Pandas DF or TXT formats.
- Mastering PDFs: Extracting Sections, Headings, Paragraphs, and Tables with Cutting-Edge Parser
- ChatGPT 유료기능 소개 (2023년 10월)
- [R] LaVIN-lite: Training your own Multimodal Large Language Models on one single GPU with competitive performance! (Technical Details)
- Fuyu-8B - Adept가 공개한 멀티모달 LLM 오픈소스 (adept.ai)
- llama.cpp server now supports multimodal!
- What are the boundaries between humans and machines?
- The GEN:48 short AI film competition by @runwayml is now closed.
- Eliciting Human Preferences with Language Models
- 애플, iOS18부터 생성형 AI 기술을 도입할 예정이라는 루머 (macrumors.com)
- awesome foundation and multimodal models
- Invoice data processing with Llama2 13B LLM RAG on Local CPU
- Invoice Data Processing with Llama2 13B LLM RAG on Local CPU [Weaviate, Llama.cpp, Haystack]
- ``Computer Vision in the Wild (CVinW)'' is an emerging research field. This writeup provides a quick introduction of CVinW and maintains a collection of papers on the topic.
- Lepton AI - A Pythonic framework to simplify AI service building
- Understanding Deep Learning
- Faker 라이브러리가 대한민국 도로명 주소 생성까지 지원합니다
- [NLP 논문 구현] pytorch로 구현하는 Transformer (Attention is All You Need)
- Open Source LLMs, Fine-Tunes and RAG Based Vector Store APIs
- DALL-E 3 Consistent Characters: Part 2 - Hope : How to write prompt ?
- Generative AI: get ready to multiply your Technical Debt Or why you need to be mindful in adopting GenAI for development
- sketchy vision - Each week I create sketches covering key Computer Vision concepts. If you want to learn more about CV stick around!
- whisper_streaming - Whisper realtime streaming for long speech-to-text transcription and translation
- DALL•E 3 is finally available to ALL ChatGPT pro users!
- 하드웨어
- 애플, M3·M3 프로·M3 맥스 출시…세부사양 모아보기
- “이젠 손색없는 미니 PC” 라즈베리 파이 5 공개
- 델 테크놀로지스-메타, 대규모 언어모델 ‘라마 2 온프레미스’ 발표
- AV1 비디오 코덱이 더 많은 하드웨어 지원을 받게됨 (fullystacked.net)
- "애플워치, 내년 모델부터 혈압도 측정"
- Through the Ages: Apple CPU Architecture - Learn how CPUs work, and discover Apple’s underrated competitive advantage.
- ‘ARM 칩’ 삼총사, ‘PC CPU 절대강자’ 인텔에 위협이 될 수 있을까
- Apple, 개인용 컴퓨터를 위한 가장 진보한 M3, M3 Pro 및 M3 Max 칩 라인업 공개 (apple.com)
- Apple, M3 칩 제품군을 탑재한 새 MacBook Pro 14/16 공개 (apple.com)
- 애플의 AirPods 로드맵 유출 (theverge.com)
- "초고가 혼수품으로 급부상?"…4700만원 넘는 이 제품은 [김익환의 컴퍼니워치]
- LINE 앱에서 음성 품질을 측정하는 방법
- Training LLMs with AMD MI250 GPUs and MosaicML
- AMD AI Software Solved – MI300X Pricing, Performance, PyTorch 2.0, FlashAttention, OpenAI Triton
- 중국산 MTT 580 GPU의 성능은 GTX 1650 수준?
- “알렉사+애플 홈+스마트 싱스…” 매터 지원 기기 2배로 늘었다
- 키크론 C3 프로 리뷰 | 적절한 타협이 만들어 낸 가성비 키보드
- "쓰레드리퍼가 돌아온다" AMD 고성능 워크스테이션 CPU 7000 시리즈 미리보기
- 'AMD표 DLSS 3 대항마' 플루이드 모션 프레임을 더한 AMD FSR 3 알아보기
- “이것저것 따져봐도…” AMD 라이젠 7000 시리즈를 사야 하는 5가지 이유
- 시놀로지 DS223j 리뷰 | “DSM 7.2와 1GbE” 장단점 뚜렷한 보급형 NAS
- "편의성·친환경성 높이고 비용·무게 낮춘다"··· 아마존, 맞춤형 종이 포장 솔루션 소개
- 퀄컴의 Snapdragon X Elite는 애플 실리콘에 대한 윈도우 세계의 대답 (arstechnica.com)
- 스냅드래곤 X 엘리트의 오라이온 PC로 내비친 '퀄컴의 자신감' 해부하기
- Play around with Code-llama on Mac! 👩💻
- Introduction to 🦜🔗LangChain and Retrieval Augmented Generation (RAG)
- Segment Anything Model + MetaCLIP
- GN⁺: NASA, 12B 마일 떨어진 우주선에 소프트웨어 업데이트 전송 (bgr.com)
- GN⁺: SiFive에서 일어나는 일: RISC-V의 위험성 (morethanmoore.substack.com)
- 읽을거리
- ‘믹스커피의 기적’은 악몽도 남겼다…나를 구한 동료들은 안전한가
- 네이버 3분기 매출·영업이익 모두 역대 최대 규모
- 액센추어의 Life Trends 2024 [65p PDF] (accenture.com)
- 2024년 서울 최고의 맛집: ② 전년도에 이어 블루리본 세 개를 유지한 맛집
- 하루 '몇 걸음' 걸어야 건강해질까? 11만 명 조사했더니…
- 균류의 대표주자인 버섯이 최고의 식재료로 떠오른 이유
- State of Brand 보고서 2023 (justcreative.com)
- 은퇴 자금 10억 필요? 은행·보험사의 공포 마케팅이다
- The complete guide to content marketing for startups
- 구글, 2021년에 모든 곳에서 기본 검색엔진이 되기 위한 비용으로 $26.3b(35조원) 지출 (theverge.com)
- 中企 3000곳 R&D '초비상'…내년 상반기 사업비 끊긴다
- 한때는 스쳐도 급등했는데…AI株의 눈물
- I distilled my 4 years of marketing lessons into minimalistic visuals.
- Google paid a whopping $26.3 billion in 2021 to be the default search engine everywhere
- 인덴트가 개척한 '롯데월드 리뷰 마케팅', 하이브도 '함박웃음'
- Destination unknown: Travellers are prone to changing their minds, and this can benefit brands
- 아무도 안 쓰는 메타버스 지원사업, 내년에도 계속된다? - 나라 곳간 비어가는데 불확실한 메타버스에 예산 쓰겠다는 정부
- 언젠가 써먹는 심리효과 101 (slashpage.com)
- 전설적 개발자 존 카맥, 메타버스 작심 비판... "머리를 쥐어뜯고 싶어"
- 억만장자 Peter Thiel(피터 틸)은 FBI 정보원이었다 (businessinsider.com)
(보너스: Is this correct? via @clcoding)
EOB
댓글 없음:
댓글 쓰기