(오늘의 짤방: How to turn the new M4-based Mac mini on/off. via @nixcraft)
- 빅데이터/인공지능
- 구글, 손글씨를 디지털로 변환하는 AI 시스템 개발
- OpenAI, 팩트 체크 벤치마크 SimpleQA 공개 (openai.com)
- This is the system prompt for Apple Intelligence. Turns out Apple's prompt engineers are as clueless about how LLM work as all the others.
- "Multimodal RAG Patterns Every AI Developer Should Know" ↓
- OmniParser for Pure Vision Based GUI Agent
- Docling parses documents and exports them to the desired format with ease and speed.
- The new Claude 3.5 Sonnet (claude-3-5-sonnet-20241022) model now supports PDF input and understands both text and visual content within documents.
- 데이터산업 동향 이슈브리프(2024년 제8호)_AI와 데이터기술을 통한 디지털 혁신과 주요기술트렌드
- GN⁺: Autodesk, 애니메이션 영화를 위한 AI도구 Wonder Animation 베타 버전 출시 (adsknews.autodesk.com)
- WhisperKit is a Swift package that integrates OpenAI's popular Whisper speech recognition model with Apple's CoreML framework for efficient, local inference on Apple devices.
- SentenceTransformers Fine-tuning Documentation
- RagBuilder is a toolkit that helps you create optimal Production-ready Retrieval-Augmented-Generation (RAG) setup for your data automatically.
- RPA의 진화인가, 혁신인가?··· 분석가들이 본 AI 에이전트 도입의 ‘골든타임’
- AI 검색 시대 개막··· 오픈AI ‘일반 소비자용’, 구글 ‘개발자용’ 검색 서비스 나란히 공개
- PG-RAG: Empowering Large Language Models to Set up a Knowledge Retrieval Indexer via Self-Learning
- Some interesting illustrations on embedding.
- 구글, AI 스튜디오 및 제미나이 API에 실시간 검색 그라운딩 지원
- 애플 인텔리전스 출시 첫날부터 환각 증세 보고..."심각하진 않지만 꽤 웃겨"
- 생성형 AI의 불편한 골짜기에 대한 고찰 (thoughtworks.com)
- OpenAI, ChatGPT 서치 기능 정식 출시 (openai.com)
- "로맨스의 끝" 해피 엔딩 아닌 마이크로소프트와 오픈AI의 공생 관계
- GN⁺: 구글 딥마인드, LLM이 생성한 텍스트를 워터마킹하고 감지하는 SynthID를 오픈소스로 공개
- Data Formulator icon Data Formulator: Create Rich Visualizations with AI
- ColPali: Efficient Document Retrieval with Vision Language Models 👀
- Taking medical imaging embeddings 3D
- Standardization Trends on Safety and Trustworthiness Technology for Advanced AI
- A beautiful equation connecting i, e and pi.
- SceneGenAgent: Precise Industrial Scene Generation with Coding Agent
- "챗GPT 플러스 vs. 코파일럿 프로" 나에게 꼭 맞는 유료 AI 챗봇 알아보기
- 생성형 AI에 대한 CIO의 회의론 "믿을 수 있는 도구인가?"
- A Survey of Small Language Models
- A Bayesian probability worksheet
- DeepFace is a lightweight face recognition and facial attribute analysis (age, gender, emotion and race) framework for python.
- Beyond Text: Optimizing RAG with Multimodal Inputs for Industrial Applications
- INTRODUCTION TO MACHINE LEARNING
- '소수'가 지배하는 컴퓨터 과학의 세계
- 구글, 크롬-제미나이 통합하는 '프로젝트 자비스' 테스트 중…더인포메이션 보도
- History of Calculus
- You can now run prompts against images, audio and video in your terminal using LLM
- “표준을 향한 첫걸음” OSI, 첫 번째 ‘오픈소스 AI 정의’ 발표
- AI 업계 새 격전지?··· “앤트로픽 이어 구글도 컴퓨터 제어 기능 ‘자비스’ 연내 출시” 더인포메이션
- PyCharm’s Interactive Tables for Data Science
- The Rise and Potential of Large Language Model Based Agents: A Survey
- "인간-AI 협업, 생각보다 효과 없다?" ... MIT 집단 지성 센터, 새로운 연구 결과 발표
- Self-planning Code Generation with Large Language Models
- Navigating LLM Deployment: Tips, Tricks, and Techniques
- NotebookLlama: An Open Source version of NotebookLM
- 코히어, AI 모델 언어 격차 해소 위한 강력한 오픈 소스 모델 출시
- GN⁺: ZombAIs - Claude Computer Use의 프롬프트 인젝션에서 C2(지휘통제)까지 (embracethered.com)
- Claude Computer Use - Vision은 궁극의 API인가? (thariq.io)
- phidata - Build Agents with memory, knowledge, tools and reasoning
- Drasi is a data processing platform that simplifies detecting changes in data and taking immediate action.
- ServerlessLLM (sllm, pronounced "slim") is an open-source serverless framework designed to make custom and elastic LLM deployment easy, fast, and affordable.
- screenshot-to-code - A simple tool to convert screenshots, mockups and Figma designs into clean, functional code using AI. Now supporting Claude Sonnet 3.5 and GPT-4O!
- How We Generated Millions of Content Annotations
- RAGChecker: A Fine-grained Framework For Diagnosing RAG
- Technology Radar Vol. 31 Oct. 2024
- LLM Reasoners is a library to enable LLMs to conduct complex reasoning, with advanced reasoning algorithms.
- 음악 생성 기술의 혁신: Diffusion 모델과 AudioGPT, Stable Audio 소개
- DocETL: Powering Complex Document Processing Pipelines
- Arch - 지능형 프롬프트 게이트웨이 (github.com/katanemo)
- Anthropic’s agentic Computer Use is giving people ‘superpowers’
- “2025년 AI 도입 전략, 수익성 중시로 전환··· 차질 불가피” 포레스터 전망
- 구글, AI 생성 텍스트 탐지 도구 '신스ID' 오픈소스로 공개
- GN⁺: 메타, 속도 향상 및 메모리 사용량 감소된 양자화(Quantized) Llama 모델 공개 (ai.meta.com)
- 사내 생성형 AI 확장하려니 새 인프라 숙제 생긴다?!
- Meta Optimizes Data Center Sustainability with Reinforcement Learning
- GN⁺: Genie - Uber의 생성형 AI 기반 On-Call Copilot (uber.com)
- 아마존, 온라인 광고 생성 도구 2종 발표 “누구나 빠르게 제작”
- AI 입지 확대··· 가트너, 2025년부터 주목할 10가지 IT 산업 전망 발표
- Microsoft GenAIScript - 생성형 AI 스크립팅 (microsoft.github.io)
- Vision-Based Mobile App GUI Testing: A Survey
- GN⁺: Anthropic, Computer Use 기능과 Claude 3.5 Sonnet/Haiku 모델 공개 (anthropic.com)
- Introducing quantized Llama models with increased speed and a reduced memory footprint
- Human brain can process certain sentences in ‘blink of an eye’, says study
- GN⁺: 이번 주 Claude Artifacts로 구축한 모든 것 (simonwillison.net)
- Stable Diffusion 3.5 공개 (stability.ai)
- GN⁺: Tokenizer에 주의를 기울여야 합니다 (cybernetist.com)
- Structured Outputs with Multimodal Gemini
- Presenting Agent.exe: the easiest way to let Claude's new computer use capabilities take over your computer!
- Why 87% of Machine learning Projects Fail
- Transformers.js v3: WebGPU Support, New Models & Tasks, New Quantizations, Deno & Bun Compatibility, and More…
- 어도비, 동영상 AI '2초 확장' 정식 출시...영상 생성 기능은 베타 테스트 시작
- Kakao AI Native - CTO Keynote
- sentient - browser controlling agents in 3 lines of code
- The RAG Playbook¶
- MS, 코파일럿 스튜디오 통해 AI 에이전트 도입 "사전 빌드 에이전트 10종"
- 펭귄 랜덤 하우스 “생성형 AI 학습에 저작물 사용 금지”
- "생산성 향상부터 훈련 최적화까지" 개발자가 사랑할 오픈소스 AI 프로젝트 11가지
- PocketPal AI is a pocket-sized AI assistant powered by small language models (SLMs) that run directly on your phone.
- MedEmbed: Fine-Tuned Embedding Models for Medical / Clinical IR
- DocLayout-YOLO - An efficient and robust Model for Real-World Document Layout Analysis.
- bitnet.cpp is the official inference framework for 1-bit LLMs (e.g., BitNet b1.58).
- GN⁺: 암 치료를 위한 새로운 AI 도구 (hms.harvard.edu)
- GN⁺: Drasi - 이벤트 구동 시스템을 위한 Microsoft의 오픈소스 데이터 처리 플랫폼 (github.com/drasi-project)
- 비디오 스크래핑: 35초 화면 캡처에서 0.1센트로 JSON 데이터 추출하기 (simonwillison.net)
- 퍼플렉시티, AI 웹 검색에 내부 문서 검색 통합..."기업용 RAG로 서비스 확장"
- Video scraping: extracting JSON data from a 35 second screen capture for less than 1/10th of a cent
- Genie: Uber’s Gen AI On-Call Copilot
- 엑셀에서 생성형 AI로··· 리버티 덴탈이 400% ROI 달성하기까지
- “AI 스태그네이션” AI 투자와 AI 도입 사이의 격차
- AKS에 Qdrant 배포하기: 쉽게 시작하는 Qdrant와 RAG 개발 환경
- 📖 PANDASAI APP - An App to interact with Pandas Dataframes using Generative AI (LLMs).
- json_repair - This simple package can be used to fix an invalid json string.
- The Ultimate Guide to Fine-Tuning LLMs from Basics to Breakthroughs
- Generative AI’s Act o1 - 에이전트 추론의 시대 개막 (sequoiacap.com)
- State of AI 리포트 2024 [구글 Slide, 213P] (docs.google.com)
- "샤인머스캣 든 손 어색"…온라인 스토어 속 판매 농부, AI?
- DataChain - 클라우드의 데이터를 보강, 변환 및 분석하는 AI 데이터 웨어하우스 (github.com/iterative)
- Just published some really cool MLX VLM cookbooks on how to do: - OCR + structured output - Object detection - Multi-image generation
- You see the length of this prompt? This is what you should have in your instruct dataset if you want to compete with the big players.
- How to build a terrible RAG system¶
- Meta Lingua is a minimal and fast LLM training and inference library designed for research.
- Experimenting with audio input and output for the OpenAI Chat Completion API
- Podcastfy.ai 🎙️🤖 - An Open Source alternative to NotebookLM's podcast feature: Transforming Multimodal Content into Captivating Multilingual Audio Conversations with GenAI
- Sharing new research, models, and datasets from Meta FAIR
- 하드웨어
- "한때 '돈줄'이었는데 이럴 수가"…삼성·SK '초강수' 던졌다
- 유럽 첫 구축··· 딥엘, 엔비디아 GB200 DGX 슈퍼팟 도입
- 록키처럼 재기할까? 인텔 코어 울트라 시리즈 2에 거는 기대
- M4 맥 미니가 설계한 사용자 경험, 얼마나 친환경적인가?
- 데이터센터 GPU는 수명이 더 짧을까?
- GN⁺: Apple, M4 맥북 프로 출시 (apple.com)
- GN⁺: Tesla, 자동차의 커넥터 표준인 Low-Voltage Connector Standard (LVCS) 제안 (tesla.com)
- 애플, M4 및 M4 프로 탑재한 맥 미니 출시…3D 랜더링 속도 최대 2.9배 빨라져
- GN⁺: Apple, M4 탑재한 새로운 Mac Mini 출시 (apple.com)
- GN⁺: 8K TV를 모니터로 사용하기 (daniel.lawrence.lu)
- GN⁺: Apple, M4 칩 탑재한 새로운 색상의 iMac 출시 (apple.com)
- GN⁺: 스마트폰 구매자들, AI보다 배터리 수명에 더 관심 (cnet.com)
- Which latency numbers you should know?
- 하이퍼쓰레딩 없는 인텔 애로우 레이크, 전력 효율 극대화와 성능 향상 달성할까
- 퀄컴과 Arm의 라이선스 분쟁으로 위험에 처한 코파일럿+ PC
- HBM보다 더 큰 경고, 삼성위기에 오버랩된 중국 반도체 굴기
- LEADS: Lightweight Embedded Assisted Driving System
- ARM 퀄컴에 "반도체 라이선스 중단" 통보, '스냅드래곤' 개발 차질 가능성
- GN⁺: 애플의 AirPods Pro 청력 건강 기능은 소리만큼이나 훌륭함 (theverge.com)
- 퀄컴, 차세대 오리온 CPU 및 스냅드래곤 8 엘리트 공개 "루나 레이크 노트북보다 빨라"
- GN⁺: 외과의사들이 수술실에서 Apple Vision Pro를 사용하는 이유 (time.com)
- "애플 워치 시리즈 10 vs. 울트라 2" 하프 마라톤에서 확인한 실제 성능
- Tesla WTF - "No Mercy / No Malice" (profgalloway.com)
- GN⁺: 미국, 테슬라의 "FSD" 치명적 사고후 자율주행 소프트웨어에 대한 조사 시작 (reuters.com)
- 읽을거리
(보너스: Stay disciplined via @PathOfMen_)
EOB