- 빅데이터/인공지능
- Contextual Document Embeddings
- 6 types of vector embeddings for your AI applications
- 아직도 포탈에서 검색?(LLM 검색 서비스를 알려드립니다. feat. 에이닷)
- Let LLM suggest Instagram hashtags for your pictures
- “오픈AI, 올해 매출 4조원, 손실 6조원··· 5년 내 매출 27배 증가 전망” 뉴욕타임즈
- Retrieval Augmented Generation (RAG) and Beyond(한국어)
- Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely
- 예상보다 더딘 M365 코파일럿 도입··· 걸림돌은 ‘ROI’와 ‘사내 데이터 정책’
- The Art of Tokenization: Breaking Down Text for AI - Demystifying NLP: From Text to Embeddings
- How to Fine-Tune GPT-4o for Object Detection
- peechBrain is an open-source PyTorch toolkit that accelerates Conversational AI development, i.e., the technology behind speech assistants, chatbots, and large language models.
- Machine Learning Zoomcamp
- 메가존클라우드, 하나투어에 맞춤형 AI 챗봇 서비스 구현 발표
- GN⁺: OpenAI, 기업 가치 평가액 209조원($157B)으로 펀딩 완료 (nytimes.com)
- OpenAI와 Anthropic의 수익 분석 (tanayj.com)
- MinerU is a tool that converts PDFs into machine-readable formats (e.g., markdown, JSON), allowing for easy extraction into any format.
- GN⁺: OpenAI Canvas - ChatGPT와 함께하는 새로운 작성 및 코딩 방식 (openai.com)
- 구글, AI 검색 서비스에 광고 탑재한다
- 마이크로소프트, 코파일럿에 ‘보이스 및 비전 기능’ 추가 “더 현실적으로 상호작용”
- The coolest visual representation of a Fourier transform. 😲 [https://bit.ly/3uCu4a9]
- Awesome Artificial Intelligence (AI)
- Made-With-ML - Learn how to combine machine learning with software engineering to design, develop, deploy and iterate on production-grade ML applications.
- Awesome Machine Learning
- 🎈 🎉 Deep Learning Drizzle 🎊 🎈
- Prompt Engineering Guide
- What Kind of Writer Is ChatGPT?
- Mathematics for Computer Science
- Mem0 (pronounced as "mem-zero") enhances AI assistants and agents with an intelligent memory layer, enabling personalized AI interactions.
- Solving data for LLMs - Create quality synthetic datasets! Dataformer empowers engineers with a robust framework for creating high-quality synthetic datasets for AI, offering speed, reliability, and scalability.
- How ‘Embeddings’ Encode What Words Mean — Sort Of
- OpenAI가 DevDay에서 발표한 모든 것들 (every.to)
- Introducing the Realtime API - Developers can now build fast speech-to-speech experiences into their applications
- GN⁺: AI 회사는 성공할 수 있는가? (benn.substack.com)
- Whisper large-v3-turbo model.
- Realtime Whisper Large V3 Turbo:
- MLX-Textgen - A python package for serving LLM on OpenAI-compatible API endpoints with prompt caching using MLX
- A simple hack to calculating how much VRAM you would need to run a model.
- Hugging Face Llama Recipes
- OpenAI DevDay 2024 live blog
- Prompt Caching in the API - Offering automatic discounts on inputs that the model has recently seen
- Whisper Web - ML-powered speech recognition directly in your browser! Built with 🤗 Transformers.js.
- NVIDIA just dropped a gigantic multimodal model called NVLM 72B 🦖
- Assisting in Writing Wikipedia-like Articles From Scratch with Large Language Models
- GN⁺: NotebookLM의 자동 생성 팟캐스트는 놀라운 정도로 효과적임 (simonwillison.net)
- GitHub Repo to Text Converter (Local Directory Supported)
- Anything-LLM - 오픈소스 올인원 AI 데스크탑 어시스턴트 (github.com/Mintplex-Labs)
- Eigenvalues & Eigenvectors clearly explained:
- Prompt Engineering Guide
- RAG Is More Than Just Vector Search
- Building an Advanced RAG System With Self-Querying Retrieval
- Whisper is a general-purpose speech recognition model.
- Open NotebookLM - Convert your PDFs into podcasts with open-source AI models (Llama 3.1 405B, MeloTTS, Bark).
- Bigger AI chatbots more inclined to spew nonsense — and people don't always realize
- WebLLM is a high-performance in-browser LLM inference engine that brings language model inference directly onto web browsers with hardware acceleration. Everything runs inside the browser with no server support and is accelerated with WebGPU.
- LLM 프로젝트를 프로덕션에 도입하기 위한 5가지 과제와 해결책
- LightLLM is a Python-based LLM (Large Language Model) inference and serving framework, notable for its lightweight design, easy scalability, and high-speed performance.
- Synthetic Data of LLMs, by LLMs, for LLMs
- AI: 디스토피아인가 유토피아인가? (khoslaventures.com)
- Tabby is a self-hosted AI coding assistant, offering an open-source and on-premises alternative to GitHub Copilot.
- AI bots now beat 100% of those traffic-image CAPTCHAs
- GN⁺: AMD, 첫 번째 소형 언어 모델 AMD-135M 공개 (community.amd.com)
- How to deploy ML models painlessly
- A Survey of Low-bit Large Language Models: Basics, Systems, and Algorithms
- Using Semantic Kernel to create multi-agent scenarios
- TransformersPHP - State-of-the-art Machine Learning for PHP. Run Transformers natively in your PHP projects
- 카카오, AI 언어모델 성능 평가 데이터셋 구축 및 오픈소스 공개
- 오픈AI, 챗GPT 어드밴스드 보이스 기능 출시 "감정 분석해 더 자연스러운 대화 가능"
- 이참에 알아둘까··· 주요 생성형 AI 용어 23가지
- STORM: Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking
- Visualize Vector Embeddings in a RAG System
- How to Visualize Embeddings from a Vector Database (Pinecone, Weaviate)
- NotebookLM - NotebookLM은 신뢰할 수 있는 정보를 기반으로 맞춤설정된 AI를 제공합니다.
- Llama-3.2 1B+3B Conversational + 2x faster finetuning
- Selection of Prompt Engineering Techniques for Code Generation through Predicting Code Complexity
- NVLM: Open Frontier-Class Multimodal LLMs
- Llama 3.2 3B & 1B GGUF Quants
- Beyond Text: The Rise of Vision-Driven Document Retrieval for RAG
- Llama 3.2 Multimodal benchmarks
- GN⁺: Meta Llama 3.2 출시 - 개방형 맞춤형 모델로 엣지 AI와 비전을 혁신하는 기술 (ai.meta.com)
- GN⁺: 영향력 있는 AI 연구를 하는 방법 (github.com/okhat)
- Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
- OpenAI’s o1-preview is the first model to substantially push the frontier of language model intelligence since the original GPT-4 over 18 months ago
- A few technical insights on the new Llama vision models we’re releasing today 🦙🧵
- Llama can now see and run on your device - welcome Llama 3.2
- Reimagining LLM-Powered Unstructured Data Analysis with DocETL
- 클라우드플레어, 'AI 오딧' 툴 공개…온라인 콘텐츠 제어권 및 공정한 거래 환경 제공
- GenAI Agents: Comprehensive Repository for Development and Implementation 🚀
- "주요 애플 인텔리전스 기능, 4개월 이내에 출시" 마크 거먼
- Awesome Open-source Text-to-music (TTM) generation: QA-MDT (OpenMusic)
- Chunking techniques for RAG:
- LLM이 아니라 애플리케이션이 필요한 이유
- Choosing Between LLM Agent Frameworks
- General OCR Theory: Towards OCR-2.0 via a Unified End-to-end Model
- Updated production-ready Gemini models, reduced 1.5 Pro pricing, increased rate limits, and more
- 185 real-world gen AI use cases from the world's leading organizations
- Recommendation with Generative Models
- Multimodal Retrieval Augmented Generation (RAG), clearly explained:
- ColPali: Efficient Document Retrieval with Vision Language Models 👀
- Retrieval Augmented Generation (RAG) and Beyond: A Comprehensive Survey on How to Make your LLMs use External Data More Wisely
- GN⁺: AI Impact 보고서 2024 : AI 도입과 혁신 현황 (konghq.com)
- Chain-of-Thought Reasoning Without Prompting
- QueryGPT – Natural Language to SQL Using Generative AI
- GN⁺: Cloudflare의 새로운 마켓플레이스, 웹사이트가 AI 스크래핑 봇 에 요금 부과 가능 (techcrunch.com)
- 사장님들의 비용은 어떻게 마법처럼 자동 분류될까?
- rerankers: A Lightweight Python Library to Unify Ranking Methods
- Introducing Contextual Retrieval
- GN⁺: ChatGPT는 잊어라: 연구자들이 이제 노트북에서 소형 AI를 실행하는 이유 (nature.com)
- 하드웨어
- OLED 노트북에서 반드시 '다크 모드'를 사용해야 하는 이유
- 아이폰 16·16 플러스 리뷰 | 더 이상 일반적이지 않은 일반 시리즈
- "사양은 강력해지는데…" PC 게임 최적화, 왜 계속 나빠질까?
- 아이폰 16 프로·프로 맥스 리뷰 | 고성능 카메라 제외하면 '굳이'
- '현실'로 돌아온 마이크로스프트…홀로렌즈 2 생산 중단
- 'AI 바디캠'이 확산하면 어떤 일이 벌어질까?
- Pitfalls of Unified Memory Models in GPUs
- GPU Puzzles
- Type 31 Frigate: Delivering a warship design solution to address navies’ personnel challenges
- GN⁺: AlphaChip이 컴퓨터 칩 설계를 혁신한 방법 (deepmind.google)
- 애플 인텔리전스 쓰려면 아이폰 용량 4GB 필요해
- 아이폰 16, 전류로 분리되는 접착제로 배터리 교체 쉬워졌다
- 인텔, CPU 충돌 문제 마지막 원인 발견…새 BIOS 업데이트 배포
- 삼성전자, 파운드리 생산라인 줄줄이 ‘셧다운’… 설비투자도 보류
- "필연적인 변화" AI PC는 얼마나 빨리 기존 PC를 대체할까?
- 생성형 AI와 기후 위기 그리고 마이크로소프트의 딜레마
- '배터리 걱정 끝' 퀄컴 스냅드래곤 X와 인텔 루나 레이크 간단 비교
- HP, 지능형 인쇄 지원 ‘프린트 AI’ 공개 "웹 인쇄도 깔끔"
- 인텔, AI용 ‘가우디 3’ 가속기 출시…엔비디아 'H100'보다 느리지만 저렴해
- GN⁺: Meta 의 Orion 공개 - 최초의 진정한 증강 현실 안경 (about.fb.com)
- "인텔 그래픽 카드 시장 점유율 0%로 추락…엔비디아 88%" JPR
- 에어팟 4 ANC 모델 리뷰 | 더 저렴한 가격으로 즐기는 프로급 성능
- 사진작가 Austin Mann의 아이폰 16 프로 카메라 리뷰 (austinmann.com)
- 읽을거리
(보너스: Machine Learning Algorithms: via @hamptonism)
EOB