오늘의 짤방: Indeed. Writing prompts is underrated. via @HamelHusain
- 빅데이터/인공지능
- 증권사, 생성형 AI 도입 활발…부작용 우려도 솔솔
- ‘AI 계획’은 잊어라?··· 예벗 박사와 나눈 이야기
- ‘기업의 AI 책임 문제 강조’… 에어캐나다 챗봇 사건의 시사점
- “애플, 생성형 AI 도입한 엑스코드 내부서 테스트 중” 블룸버그
- 구글 제미나이 안드로이드 어시스턴트의 진짜 문제
- 엔비디아, 구글과 협력해 AI 모델 ‘젬마’ 최적화
- “AI가 역사 왜곡한다” 주장에… 구글, 제미나이 이미지 생성 기능 일시 중단
- 전화위복된 유료화 정책?··· “레딧, 6천만 달러 규모 데이터 판매 계약 체결” 블룸버그
- “여러 LLM를 통합할 때 유용”··· 콩, AI 개발 특화 API 플러그인 오픈소스로 공개
- 🪆 2D Matryoshka Sentence Embeddings
- Introducing LlamaCloud and LlamaParse
- GN⁺: Phind-70B 공개 - GPT-4 Turbo와 코드 품질 격차를 줄이면서 4배 빠른 실행 가능한 모델
- 구글, 초경량 오픈소스 AI 모델 ‘젬마’ 공개 “책임감 있는 AI 개발 지원”
- MLXChat macOS SwiftUI App - A macOS SwiftUI Application for prompting LLM Model.
- 🪆 Introduction to Matryoshka Embedding Models
- NotesOllama - 애플 메모 앱 안에서 LLM과 대화하기 (github.com/andersrex)
- MedAlign: A Clinician-Generated Dataset for Instruction Following with Electronic Medical Records
- NeuScraper - Cleaner Pretraining Corpus Curation with Neural Web Scraping
- Here are five key takeaways/properties that make Gemma different from other alternatives…
- Inspired by Karpathy's tokenization post - If you are using gpt-4-turbo-preview to read tables from plain text, format it in markdown, and merge all whitespace to a single space:
- OpenLLMetry - LLM 어플리케이션을 위한 오픈소스 Observability (github.com/traceloop)
- GPTScript - OpenAI LLM과의 상호작용을 자동화하는 새로운 스크립팅 언어 (github.com/gptscript-ai)
- TinyLLaVA: A Framework of Small-scale Large Multimodal Models
- Here are the memory specs for the recent high end accelerators (GPU)
- Stable Diffusion 3 발표 (stability.ai)
- YOLO (unofficial and incomplete) history
- Colbert Rerank
- RAG Microservices 🔥🛠️
- GN⁺: 구글, 역사적 이미지 묘사에서 문제 발생 후 Gemini 의 이미지 생성 중단 결정 (theverge.com)
- Sora 후기 - 주관식의 시대가 끝나다 -
- JAX Gemma on Colab TPU
- Computer Vision with Free Satellite Data
- Stable Diffusion 3
- 툰스퀘어의 생성형 AI 모델 배포를 위한 Amazon SageMaker 활용 사례
- YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
- Build a Large Language Model (From Scratch)
- Advanced RAG with LlamaIndex
- Advanced Retrieval-Augmented Generation: From Theory to LlamaIndex Implementation - How to address limitations of naive RAG pipelines by implementing targeted advanced RAG techniques in Python
- Naive RAG with LlamaIndex
- Text Embeddings Inference - A blazing fast inference solution for text embeddings models.
- Scaling ChatGPT: Five Real-World Engineering Challenges
- GN⁺: Gemini Pro 1.5의 킬러 앱은 비디오입니다 (simonwillison.net)
- Unveiling the Power of RAG: Building an Interactive Chatbot with React — A Comprehensive Guide(코드)
- 한국어 Reranker를 활용한 검색 증강 생성(RAG) 성능 올리기
- 젬마(Gemma) - 구글의 최첨단 오픈 모델 (blog.google)
- “세계 최고 SLM 간편하게 사용해본다!”...업스테이지, 자체 언어모델 ‘솔라’ API 무료 공개
- lamaCloud 와 LlamaParse 공개 (blog.llamaindex.ai)
- YOLO-World - an innovative approach that enhances YOLO with open-vocabulary detection capabilities through vision-language modeling and pre-training on large-scale datasets.
- ollama run gemma
- Welcome Gemma - Google’s new open LLM
- Gemma: Introducing new state-of-the-art open models
- Gemma: Open Models Based on Gemini Research and Technology
- The killer app of Gemini Pro 1.5 is video
- A Survey of Production RAG Pain Points and Solutions
- 12 RAG Pain Points and Proposed Solutions
- GN⁺: 제프 딘: 머신 러닝의 최신 동향 [비디오] (youtube.com)
- CopilotKit - The Open-Source Copilot Platform
- MLX-graphs is a library for Graph Neural Networks (GNNs) built upon Apple's MLX.
- GN⁺: GPT 토크나이저 구축하기 by Andrej Karpathy [동영상] (youtube.com)
- minbpe - LLM 토큰화에 사용하는 Byte Pair Encoding 구현체 (github.com/karpathy)
- CS6208 : Advanced Topics in Artificial Intelligence Graph Machine Learning(깃헙)
- Rag From Scratch: Query Transformations
- calculate Sora's Diffusion Transformer (DiT) by hand.
- Introducing LlamaCloud and LlamaParse
- 에어캐나다 울린 '이것'...생성형 AI 도입 기업들 '비상'
- Meta V-JEPA: Yann LeCun의 고급 기계 지능(AMI)을 향한 다음 단계 (ai.meta.com)
- phidata - 함수 호출로 AI 비서를 만드는 툴킷 (github.com/phidatahq)
- Comparison between RAG and Fine-tuning
- Run BioMistral 7B 🤙
- [1hr Talk] Intro to Large Language Models by Andrej Karpathy
- Set Theory symbols. Useful.
- LLM Comparator - Visual Analytics for Side-by-Side Evaluation of Large Language Models
- Find the AI Approach That Fits the Problem You’re Trying to Solve
- LangChain 101: Part 3b. Talking to Documents: Embeddings and Vectorstores (updated ‘24)
- Groq's LPU is faster than Nvidia GPUs, handling requests and responding more quickly.
- 생성AI 덕분에 진성고객, 충성고객 늘어난다 (마이크로소프트 정우근 팀리드)
- 프로슈머의 미래: "AI Native" 워크플로우의 부상 (a16z.com)
- Ollama, 윈도우 버전 프리뷰 시작 (ollama.com)
- The Shift from Models to Compound AI Systems
- Gemini Pro 1.5 vs RAG
- minbpe - Minimal, clean code for the (byte-level) Byte Pair Encoding (BPE) algorithm commonly used in LLM tokenization. The BPE algorithm is "byte-level" because it runs on UTF-8 encoded strings.
- Scaling RAG for Production
- GN⁺: Magika: AI를 활용한 빠르고 효율적인 파일 유형 식별도구 오픈소스 (opensource.googleblog.com)
- World Model on Million-Length Video and Language with RingAttention
- Maximizing the Utility of Large Language Models (LLMs) through Prompting
- 오픈AI Sora 리서치 페이퍼 : 월드 시뮬레이터로서의 비디오 생성 모델
- "챗GPT는 지난 여름에 네가 한 일을 알고 있다" 오픈GPT, 메모리 기능 발표
- 구글, ‘제미나이 1.5 프로’ 공개…토큰 100만 개 이상 수용
- 챗GPT 비디오 버전 나오나··· 오픈AI, 영상 생성 AI 모델 ‘소라’ 공개
- “다음 단어 예측 엔진” LLM 알고리즘의 이해
- MultiModal RAG for Advanced Video Processing with LlamaIndex & LanceDB
- 테일러 스위프트 딥페이크 사태와 ‘마이크로소프트’
- “2024, 조지 오웰” 직원 감시에 이용되는 AI
- GN⁺: Reor - 로컬에서 모델을 실행하는 AI 노트 앱 (github.com/reorproject)
- NVIDIA Chat with RTX hands-on: This local AI chatbot already shows plenty of promise
- This LlamaPack implements the Corrective Retrieval Augmented Generation (CRAG)
- DoRA: Weight-Decomposed Low-Rank Adaptation
- 2023 Year in Review: AI/LLMs, Tech Leadership, Platform Engineering, and Architecture + Data
- A Human-Inspired Reading Agent with Gist Memory of Very Long Contexts
- 📺 ML YouTube Courses
- GN⁺: 구글의 차세대 모델: Gemini 1.5 (blog.google)
- Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context
- GN⁺: OpenAI의 미국 상표 "GPT" 출원 실패 (tsdr.uspto.gov)
- awesome-Face_Recognition - 👉 AI Face Recognition
- GN⁺: OpenAI Sora: 텍스트에서 비디오를 생성하는 AI 모델 공개 (openai.com)
- Lag-llama - 시계열 예측을 위한 첫번째 오픈소스 파운데이션 모델 (github.com/time-series-foundation-models)
- Our next-generation model: Gemini 1.5
- Understanding LLMs: A Comprehensive Overview from Training to Inference
- llmware - RAG을 포함한 LLM 기반 어플리케이션 개발용 통합 프레임워크 (github.com/llmware-ai)
- Rethinking Machine Unlearning for Large Language Models
- GN⁺: 애플, 지시 기반 이미지 편집을 위한 혁신적인 AI 모델 "MGIE" 출시 (venturebeat.com)
- Unboxing Nomic Embed v1.5: Resizable Production Embeddings with Matryoshka Representation Learning
- ⚔️ WildVision Arena ⚔️ : Benchmarking Multimodal LLMs in the Wild
- wevi: word embedding visual inspector
- MS가 꼽은 ’24년 AI 트렌드3′, 소형언어모델-멀티모달-과학분야 新가능성
- Lumos : Empowering Multimodal LLMs with Scene Text Recognition
- AutoMathText: Autonomous Data Selection with Language Models for Mathematical Texts
- Awesome Machine Learning On Source Code
- AQLM transformers integration example
- Fast-LLM powered by Candle 🦀
- Build your own Visual RAG Application using less than 300 lines of code.
- 클라우드 기반 생성형 AI를 위한 3가지 킬러 앱
- LLM Agents can Autonomously Hack Websites
- 새로운 유통 채널로서의 AI 에이전트 (kojo.blog)
- Show GN: AutoRAG: 자동으로 최적의 RAG 파이프라인을 찾아주는 자동화 툴 (github.com/Marker-Inc-Korea)
- CodeSage: Code Representation Learning At Scale(소스 코드에 특화된 임베딩, 논문)
- AI 시대에도 ‘아래아한글’ 집착 못 버리는 정부… 공공데이터 활용 못하고 글로벌 트렌드 뒤처져
- GN⁺: ChatGPT, 메모리 및 새로운 제어 기능 추가 (openai.com)
- A team from Google found that smaller variants of T5 and UL2 outperform BM25 on datasets like BEIR.
- MIT University just released free online courses.
- Memory and new controls for ChatGPT
- Large Language Models: A Survey
- 7 Query Strategies for Navigating Knowledge Graphs With NebulaGraph and LlamaIndex
- Building A Graph & LLM-Powered RAG Application from PDF Documents
- today i found out that this one australian guy has been toiling away making incredibly detailed Neural Circuit Diagrams with the vibe of a 1950s issue of Popular Mechanics, but content fit for the 2020s
- 구글 Bard, 이제 Gemini(제미나이)가 되다 (blog.google)
- No GPU? No problem. localllm lets you develop gen AI apps on local CPUs
- Fine-Tuning with LoRA or QLoRA
- GN⁺: AMD가 자금을 지원한 ROCm 기반 드롭인 CUDA 구현체, 이제 오픈소스로 공개 (phoronix.com)
- Surya - Surya is a document OCR toolkit
- LlamaIndex v0.10
- Using MLX at Hugging Face
- Machine Learning Engineering Open Book(BLOOM-176B 파인 튜닝 사례)
- Welcome to the PEFT (Pretraining-Evaluation Fine-Tuning) project repository! This project focuses on efficiently fine-tuning large language models using LoRA and Hugging Face's transformers library.
- Understanding the difference between RPA and AI
- LLM Inference - HW/SW Optimizations(한국어 번역)
- NeMo Guardrails, the Ultimate Open-Source LLM Security Toolkit
- NeMo Guardrails, the Ultimate Open-Source LLM Security Toolkit(깃헙)
- fabric - AI를 사용하여 인간을 강화하기 위한 오픈소스 프레임워크 (github.com/danielmiessler)
- WhisperKit - Whisper를 iOS와 macOS에서 쉽게 사용하기 (github.com/argmaxinc)
- crewAI is designed to facilitate the collaboration of role-playing AI agents.
- 10 great Python packages for Data Science not known to many:
- 하드웨어
- 애플 비전 프로 리뷰 | ‘미리 만나는’ 미래 공간 컴퓨팅 세상
- “거품 걷고 냉정하게…” AI PC의 현주소와 구매를 위한 조언
- SPEC, 인텔 제온 CPU 벤치마크 조작 의혹 제기
- "애플 비전 프로, 맥을 대체할 수 있을까?" 가능성과 불확실성
- 인텔 파운드리, 큰 손 잡았다 “MS와 150억 달러 칩 제조 계약 체결“
- “피 뽑지 않고 혈당 측정?... 이런 스마트워치는 사기”
- 전기차는 바겐세일 중…하이브리드 르네상스 [스페셜리포트]
- GN⁺: 아사히 리눅스의 애플 실리콘 OpenGL 지원, 공식적으로 애플을 초월 (arstechnica.com)
- Nvidia's Computational Lithography Breakthrough
- 라즈베리 파이 5 리뷰 | 싱글보드 초소형 컴퓨터의 비약적인 업그레이드
- AI 네트워킹, 인피니밴드에서 이더넷으로 대세 바뀐다 - LLM 환경에서 GPU 통신이 인프라 부담 대폭 키워
- Top 10 Data & AI Trends for 2024
- 읽을거리
보너스: I thought this was a cool question/tweet from @yoheinakajima As the dark area grows (more tech is created)... 1. The dark area consumes more white space (it eats up jobs) 2. The white space grows into the grey (more jobs get created) via @GregKamradt