- 빅데이터/인공지능
- Explainer: What is a foundation model?
- 캐글에서 살펴본 RAG 트렌드 살펴보기 (1)
- The Swiss Army Llama is designed to facilitate and optimize the process of working with local LLMs by using FastAPI to expose convenient REST endpoints for various tasks
- CS109: Probability for Computer Scientists
- Finetuning LLMs with LoRA and QLoRA: Insights from Hundreds of Experiments
- CS109: Probability for Computer Scientists (by Stanford)
- RealtimeSTT - Easy-to-use, low-latency speech-to-text library for realtime applications
- llama2.mojo on M2 MBP seems to be much faster than llama2.c
- PyTorch Edge: ExecuTorch로 모바일 및 엣지 기기에서 온 디바이스 추론하기 (pytorch.org)
- ⭐️ Multi-Vector Retriever for RAG on tables, text, and images ⭐️
- ExecuTorch is an end-to-end solution for enabling on-device inference capabilities across mobile and edge devices including wearables, embedded devices and microcontrollers.
- AI just killed Excel forever. Introducing Rows AI, the ultimate AI tool to replace Excel (100% Free):
- Waymo advances AI research with our multifunctional Waymax simulator
- ‘애널리틱스와 머신러닝,클라우드 활용해 투석 합병증을 예측’··· 독일 프레제니우스의 혁신 여정
- GPT-4 Vision 프롬프트 인젝션 (blog.roboflow.com)
- STRATEGIC GAME DATASETS FOR ENHANCING AI PLANNING: AN INVITATION FOR COLLABORATIVE RESEARCH
- Taking your Streamlit Apps to the Next Level with GPT-4
- Goedel machines are self-referential universal problem solvers making provably optimal self-improvements.
- 🌟 Introducing Gradio-Lite! 🌟 Use Gradio right in your web browser with our new library that leverages Pyodide to run full machine learning apps entirely in your browser.
- Tokenizers - Provides an implementation of today's most used tokenizers, with a focus on performance and versatility.
- TL; DR: PixArt-α is a Transformer-based T2I diffusion model whose image generation quality is competitive with state-of-the-art image generators (e.g., Imagen, SDXL, and even Midjourney), and the training speed markedly surpasses existing large-scale T2I models, e.g., PixArt-α only takes 10.8% of Stable Diffusion v1.5's training time (675 vs. 6,250 A100 GPU days).
- n8n LangChain Integration - Your next LLM app in minutes with LangChain on n8n’s low-code platform
- DALL·E 3 is now available in ChatGPT Plus and Enterprise
- FastEmbed is a lightweight, fast, Python library built for embedding generation.
- Constructing knowledge graphs from text using OpenAI functions
- Extract tables from documents using @llama_index
- 🪓 metadata enhanced RAG
- You can now generate AI images inside Google Slides (for free).
- ‘오픈소스’가 AI 분야에서 실패하지 않도록 하려면
- "기계가 도구에서 팀원으로 변화 중··· CIO 비전 제시 필요" 가트너
- 마이크로소프트, ‘애저 AI 콘텐츠 세이프티’ 출시 "콘텐츠 유해성을 점수로 표시"
- "AI옵스 시장, 2028년까지 연간 22.7% 성장" 마켓앤마켓
- 가트너, 2024년 10대 전략 기술 트렌드 발표
- 생성형 AI, 2027년까지 연평균 76.8% 성장할 것…IDC
- Fuyu-8B: A Multimodal Architecture for AI Agents
- “검색창에서 이미지 & 문서 초안 생성”··· 구글, AI 기반 검색 경험 소개
- The Rise of the AI Engineer
- How ChatGPT is transforming the postdoc experience
- TabLib - 867B Tabluar Token 데이터셋 (approximatelabs.com)
- Invoice data processing with Mistral LLM on local CPU
- Invoice Data Processing with Mistral LLM on Local CPU
- GN⁺: USB-C 헤드 투 헤드 비교 (lumafield.com)
- Insanely Fast Whisper - Transcribe 300 minutes (5 hours) of audio in less than 10 minutes
- Various types and techniques employed in RAG, Prompt, and Finetuning.👇
- Pipeless - An open-source computer vision framework.
- faer is a collection of crates that implement low level linear algebra routines in pure Rust.
- 건질 수 있는 의료 데이터 3% 불과 "클라우드+AI로 97% 공략"
- Show GN: RAGchain : 고급 RAG 시스템을 만드는 Langchain의 확장 프레임워크 (github.com/NomaDamas)
- Eleven Labs, AI Dubbing 발표 (elevenlabs.io)
- Open questions for AI engineering
- While building our open-source vector embedding pipeline VectorFlow (https://lnkd.in/en6FhfN9)
- VectorFlow - Open source, high-throughput, fault-tolerant vector embedding pipeline
- llm - Large Language Models for Everyone, in Rust
- stable-fast is an ultra lightweight inference optimization library for HuggingFace Diffusers on NVIDIA GPUs.
- TensorRT Extension for Stable Diffusion - This extension enables the best performance on NVIDIA RTX GPUs for Stable Diffusion with TensorRT.
- burn - This library strives to serve as a comprehensive deep learning framework, offering exceptional flexibility and written in Rust.
- ⭐️ Semi-structured RAG ⭐️
- 구글 도약에 검색시장 60% 점유율 붕괴된 네이버, 돌파구는?
- Large Language Models for Software Engineering: Survey and Open Problems
- 데이터는 여전히 해자(Moat)일까? (matt-rickard.com)
- 구글, 생성형 AI의 학습 데이터 IP 분쟁시 사용자 보호안 발표
- We’re rolling out access to http://Claude.ai to more people around the world.
- Microsoft AutoGen - 차세대 LLM 어플리케이션을 위한 프레임워크 (microsoft.github.io)
- ElasticSearch Agent based on LangChain
- Developer quickstart - Get up and running with the OpenAI API
- RAG and Parent Document Retrievers: Making Sense of Complex Contexts with Code
- Using large language models in psychology:
- 2023 and Beyond: The Future of Data Science Told By 79,306 People
- Multi-modal LLMs unlock new opps for RAG apps. Ideas+cookbooks (w/ LLaVA-7b as a demo) below:
- 2024년도 과기정통부 AI 예산 대폭 삭감, 인공지능 현장 경보음...한국인공지능협회, 심각한 우려 표명
- Scaling Large (Language) Models with PyTorch Lightning
- BoTorch - Bayesian Optimization in PyTorch
- Axolotl is a tool designed to streamline the fine-tuning of various AI models, offering support for multiple configurations and architectures.
- BakaLog - A command-line tool that structures structures logs to in-process OLAP database without any preparation, leveraging template patterns generated by GPT-4. (previous name was log2row)
- The Little Book of Deep Learning, François Fleuret, University of Geneva
- GitHub Copilot은 사용자당 월 평균 20달러의 적자를 보고 있음 (thurrott.com)
- 래리 엘리슨 오라클 창업자가 바라본 AI 그리고 오라클의 비전
- Build a RAG Application from Scratch 🐕 This video covers the architecture behind Verba 0.3.0! The design behind Verba is to have an explicit manager for each core component of RAG pipelines (Read, Chunk, Embed, Retrieve, Generate)
- 구글, 생성형 AI기반 검색(SGE)에서 이미지 생성 지원 시작 (blog.google)
- Adobe MAX 2023의 핵심 발표 정리 (designshack.net)
- OpenAI, 다음달에 AI 개발 효율성을 높이기 위한 주요 업데이트 공개 예정 (gizmochina.com)
- LLM 생성 모델 - 챗봇 구축 전략 (HelpNow)
- Augmenting LLMs with RAG
- Text Embeddings Inference - A blazing fast inference solution for text embeddings models.
- If you are using jupyter notebooks for Python and Data Science, try these 7 magic commands that will save you a ton of time:🧵
- 벡터 유사도 검색으로 추천 서비스 구현하기
- GN⁺: OpenAI는 너무 저렴해서 이길 수 없다 (generatingconversation.substack.com)
- Best Generative AI Courses Online & Certifications
- [유머] 챗gpt+빙 ai이미지 더하니까 미쳤다
- 한편 중국은 딥페이크 기술로 24시간 연중무휴 라이브 스트리밍을 실현하며 AI 스트리머 양산 공장이 되어가고 있습니다.
- "생성형 AI 앱, 2026년이면 기업 80% 이상이 사용"··· 가트너, 생성형 AI 하이프사이클 발표
- 네이버 “하이퍼클로바X, 창작 도구로 활용 범위 확장한다”
- “생성형 AI로 HR 업무 생산성 UP” 메가존클라우드가 전하는 실전 활용 노하우
- 개발새발 그려도 AI가 알아서 그림 ‘뚝딱’...어도비 신기술 공개 [어도비 맥스 2023]
- "생성 AI 스타트업, 비용 문제 등으로 내년이 고비"
- magentic - LLM을 파이썬 함수로 심리스하게 연동 (github.com/jackmpcollins)
- vec2text - This library contains code for doing text embedding inversion. We can train various architectures that reconstruct text sequences from embeddings as well as run pre-trained models.
- Text Embeddings Reveal (Almost) As Much As Text
- LLM prompting guide
- Image tasks with IDEFICS
- Multi-modal LLMs unlock RAG on images.
- MemGPT - Towards LLMs as Operating Systems
- Vector Databases — a list…
- Can you run it? LLM version
- Candle is a minimalist ML framework for Rust with a focus on performance (including GPU support) and ease of use.
- Introducing Refact Code LLM: 1.6B State-of-the-Art LLM for Code that Reaches 32% HumanEval
- Rivet Is An Open-Source Visual AI Programming Environment - Rivet is suited for building complex agents with LLM Prompts, and it was Open Sourced recently.
- Guidance enables you to control modern language models more effectively and efficiently than traditional prompting or chaining.
- Whose IP Is It Anyway? AI Code Analysis Can Help
- Zep: Fast, scalable building blocks for LLM apps
- CoTracker: It is Better to Track Together
- Hugging Face presents "Training Cluster" As a service - Train your LLM at scale on our infrastructure
- Stable Audio: Fast Timing-Conditioned Latent Audio Diffusion
- Microsoft announces new Copilot Copyright Commitment for customers
- LLMs, RAG, & the missing storage layer for AI
- Google’s AI assistant can now read your emails, plan trips, “double-check” answers
- Amazon Limits Authors to Self-Publish 3 Books a Day to Combat AI-Generated Material
- These new tools could make AI vision systems less biased
- FACET: Benchmarking fairness of vision models
- Getty Images promises its new AI contains no copyrighted art
- 레드햇 “내년 AI 운영 지원 본격화… 기존 클라우드·엣지도 확장”
- "데이터 편향, 금융권 생성형 AI 도입의 선결 과제" 잉글랜드 은행
- LG CNS, 기업용 생성형 AI 플랫폼 ‘DAP 젠AI’ 출시
- Performance of ChatGPT, human radiologists, and context-aware ChatGPT in identifying AO codes from radiology reports
- I’m excited to present “text-to-pgvector”
- bge-micro-v2 - This is a sentence-transformers model: It maps sentences & paragraphs to a 384 dimensional dense vector space and can be used for tasks like clustering or semantic search.
- Thoughts on Chinchilla - How to (and not to) interpret the scaling laws
- Compare Embeddings for retriever
- How long does it take to download Llama2 70B?
- 구글, 버텍스AI에 ‘의료 및 생명과학’ 공략한 검색 기능 강화
- 기업의 생성형 AI 프로젝트가 ‘실패’하는 4가지 이유
- 생성형 AI 시범 도입 기업 6개월새 3배 증가…가장 적극적인 분야는 ‘SW개발’
- 제프리 힌턴 인터뷰
- Machine Learning Engineering Guides and Tools
- 생성형 AI’, 소프트웨어 기업에 어떤 의미일까?
- 어도비, 차세대 파이어플라이 모델 공개
- Replit AI, 모든 사용자에게 무료로 공개 (blog.replit.com)
- ‘생성형 AI 품는다’ SW 벤더 14곳의 속도전 이모저모
- 7 Query Strategies for Navigating Knowledge Graphs With NebulaGraph and LlamaIndex
- How to Build a Real-Time Feature Pipeline In Python
- The recent @huggingface zephyr-7b-alpha model outperforms ChatLlama 70B 😮
- 포스코, 사내 업무시스템과 결합한 P-GPT(Private GPT) 플랫폼을 도입
- 우리은행, 직원용 '인공지능 지식상담 시스템' 도입
- Nougat OCR loader - This loader reads the equations, symbols, and tables included in the PDF.
- DataLens - Yandex가 오픈소스로 공개한 BI 도구 (github.com/datalens-tech)
- Real-time Audio-visual Speech Recognition
- Revolutionizing graphic design: Try out the latest innovative Adobe Illustrator features
- Why ensembles work in machine learning:
- 🌋 LLaVA: Large Language and Vision Assistant
- ChatGPT Dall-E 3 시스템 프롬프트 유출 (twitter.com/Suhail)
- GPT-4V is blowing my mind
- Multimodality and Large Multimodal Models (LMMs)
- A step beyond naive text-splitting ✂️: our UnstructuredElementNodeParser 👷
- OpenAI, Python SDK v1.0.0 베타버전 공개 (github.com/openai)
- DEEP LEARNING COURSE - You can find here slides, recordings, and a virtual machine for François Fleuret's deep-learning courses 14x050 of the University of Geneva, Switzerland.
- Numbers every LLM developer MUST know 🤯
- The Alignment Handbook - Robust recipes to align language models with human and AI preferences.
- Text splitting is a crucial component of setting up an ETL pipeline for your LLM/RAG app. But you can do way more than split in a flat list!
- Llama 2 Everywhere (L2E) - 스탠드얼론, 바이너리 포터블, 부팅 가능한 Llama 2 (github.com/trholding)
- MS “AI는 단순 기술 아니다…새 도구이자 역량의 집합체”
- 구글, AI 검색으로 '환자 의료정보 한눈에' 본다
- Tutorial: How to chat with your documents
- Kosmos-2: Grounding Multimodal Large Language Models to the World
- Timeline of AI and language models
- How to Generate Mock Survey Data using Python
- Large Language Models (in 2023)
- Large Language Models (in 2023)
- Building a serverless document chat with AWS Lambda and Amazon Bedrock
- Statistics 110: Probability by Harvard University
- Deep Learning: CS 182 Spring 2021 by UC Berkeley
- Introducing Pytimetk: Time Series Analysis in Python
- TPU Starter - Google Cloud TPU에 대한 모든 것
- 한글 맞춤법 검사기 개발…30년째 취준생 등불 됐다
- DocsGPT is a cutting-edge open-source solution that streamlines the process of finding information in project documentation.
- I built an AI doctor with ChatGPT - Full Clinical Experience
- Is GPT Engineer Actually Useful? 🤨
- LLM Compatibility Tracking by llamaindex
- FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation
- Mastering Customer Segmentation with LLM
- Sam Altman Says He Intends to Replace Normal People With AI
- ChatGPT-4 Prompts Cheat sheet 🔥
- Use GPT-4 PLUS Browsing To Create a Powerful Market Analysis✍️
- Face Recognition using Python and OpenCV
- Generative AI Lifecycle Patterns
- TimeGPT-1 - In this paper, we introduce TimeGPT, the first foundation model for time series, capable of generating accurate predictions for diverse datasets not seen during training.
- ChatGPT Prompt Cheat Sheet: This is a simple yet powerful way to use ChatGPT. Take the role of [EXPERT ROLE ] Create [TASK ] for [TARGET AUDIENCE]
- Huge ChatGPT CheatSheet
- Retrieval meets Long Context Large Language Models
- Using Jupyter AI
- RA-DIT: A very interesting paper from Meta on improving RAG systems using two techniques.
 
- 하드웨어
- What Every Developer Should Know About GPU Computing
- 14세대 랩터 레이크 리프레시 "성능 개선은 미미, AI 활용이 특징"
- “최신 아이폰에서 아이패드, 맥까지” 모든 애플 실리콘 성능 비교 가이드
- What’s inside Apple’s $129 Thunderbolt cable? We CT scanned one to find out, and compared it to some cheaper cables… 🧵
- “부팅 오류부터 화면 먹통까지” 라즈베리 파이 문제 해결 가이드
- 윈도우 11의 엄격한 하드웨어 요구사항을 우회하는 간단한 방법
- 의식의 흐름대로 제품 만들다가 대기업이 된 회사.jpg
- "온디바이스에서 생성형 AI 지원"··· 구글 텐서 G3 발표
- 아이폰 15의 '과열 게이트', 애플은 어떻게 대처했나?
- 오픈 AI와 마이크로소프트가 자체 칩을 만들려는 이유
- AR 글래스의 대중화를 이끌 단 하나의 열쇠
- GN⁺: Starlink Direct To Cell - 전세계 LTE폰에 문자/음성/데이터 위성서비스 (direct.starlink.com)
- 메타 퀘스트 3 리뷰ㅣ전작 있어도 구매할 만한 보급형 ‘MR 헤드셋
- "3분기 PC 출하량 9% 감소··· 4분기부터 반전 유력" 가트너
- 종양 미생물군집: 암 치료 위한 새로운 수단
- This infographic that we've just created breaks down the key chip suppliers for $AAPL's iPhone 15 Pro – the majority of which are publicly traded.
- 업비트 · 빗썸 빼고 거래소 모두 적자…30대 남성 주력–1억원 이상 보유자 4.4만명
- Microsoft, Ignite 2023에서 첫번째 AI칩을 발표할 수도 (windowscentral.com)
- OpenAI, 자체 AI 칩 개발 고려 중 (techcrunch.com)
- GN⁺: AMD는 어떻게 CUDA 해자를 넘을 수 있을까 (hpcwire.com)
- Today, I'll clearly explain KNN & we implement it from scratch using Python!🔥
- Retrieval Augmented Generation at Planet Scale
 
- 읽을거리
- "사업 50년만에 올 첫 적자"…경기침체·3高 겹쳐 최악 위기
- 누가 어떻게 사모펀드 매니저가 되는가 [김태엽의 PEF썰전]
- "한계 부딪혀"...美 레딧, '블록체인' 포인트 없앤다 프로그램 중단 사유로 수수료·규제 문제 언급
- 머스크 인수 효과 없나?··· 시밀러웹, “X 사용자 수 1년간 감소 추세”
- 가트너 “2024년 세계 IT 지출, 전년 대비 8% 성장 전망”
- 국밥에 진심인 블로거
- “경기회복? 나만 딴나라 사나”…어음부도·줄파산 ‘쓰나미 공포’
- One year post-acquisition, X traffic and monthly active users are in decline, report claims
- 경제금융용어 700선 by 한국은행
- 간편결제 상위 9개사 이용금액 및 결제수수료 수익
- 한국형 컨슈머리포트의 새로운 브랜드 네임 ‘비교공감’입니다.
- 2022년 기준 한국 출판 생산 통계
- 최저임금 핵심 결정기준 가구생계비 연구
- “내년 최저임금, 현실 제대로 반영했더니…최소 월 255만원은 돼야”
- 구글, 애플, 틱톡까지… 빅테크 기업 잡는 ‘디지털 시장법’
- 유튜브도 독서인가
- 양배추 키우기 +0
- ‘2류 시민’ 취급 받던 계약직의 인생 역전…엄마는 노벨상, 딸은 올림픽 金
- 비행기에 유압이 다 빠져나가면 벌어지는 일 (3), DHL기 미사일 피습 사건
- 페북 여왕 ‘킴 카스트로’와 사랑에 빠지다…로맨스스캠 체험기
- 독립 단편 애니메이션 (2023년 업로드)
- 퇴사하고 싶은 분들만 들어오세요(ft.9년차 자영업자(전직 회사원)
- 빅쇼트를 썼던 마이클 루이스가 Going Infinite 이라는 FTX와 Sam 에 대한 책을 썼는데 내용이 상당히 충격적이네요. WSJ에 나온 기사에서 일부 발췌합니다. (1/n)
- 캡콤 역사상 가장 치명적인 실수.jpg
 
보너스: the cost of sequencing a human genome was over $300 million in 2001. today, it's a $200. expect similar cost reduction curves in AI over the next 20 years. via @mustafasuleyman
EOB


 
 
댓글 없음:
댓글 쓰기