- 빅데이터/인공지능
- Optimizing LLM latency - An exploration of inference tools for open source LLMs focused on latency.
- '1세대 챗봇' 심심이, 하버드대학교에 4억명 대화 데이터 제공
- Awesome JSON Datasets - A curated list of awesome JSON datasets that don't require authentication.
- Data Visualization Interfaces in Python With Dash
- Sample Chat App with AOAI - This repo contains sample code for a simple chat webapp that integrates with Azure OpenAI. Note: some portions of the app use preview APIs.
- Raising the Cost of Malicious AI-Powered Image Editing
- 포티투닷 AI챗봇, 현대차에 심는다
- Many people struggle to understand #Bayesian updating! So I made this super cool #Python @matplotlib #educational, interactive dashboard.
- How many GPUs to run full parameter fine tuning on llama-2 70B? Looks like it will be roughly 32 GPUs using deepspeed (A10 GPU 24GB, comparable to a 3090) or 10-12~ A100 80GB. H/T @CyrusHakha for sharing numbers
- GPT-4 + Streaming Data = Real-Time Generative AI
- Build a real time feature pipeline in python step by step
- Are the scaling Laws for LLMs shifting🤔 Earlier this year, we started to see training smaller LLMs for longer, but why? 💭
- Rebel + LlamaIndex Knowledge Graph Query Engine
- Exploring the Most Popular Machine Learning and Deep Learning GitHub Repositories
- “패브렉스 기술로 32개 GPU를 한 서버에 결합”··· 기가아이오, 싱글노드 AI 슈퍼컴퓨터 출시
- AI 포트폴리오 강화하는 AWS··· 아마존 베드록 업데이트 및 헬스케어용 AI 서비스 출시
- AWS, 생성형 AI 기반의 임상 문서 자동 생성 서비스 ‘AWS 헬스 스크라이브’ 출시
- 3 ingredients - to solve a business problem using LLMs
- "냉각, 전력까지 총체적 부족" 생성형 AI 대비 시급한 데이터센터
- Datadog Creates Scalable Data Ingestion Architecture
- Tales of Kafka at Cloudflare: Lessons Learnt on the Way to 1 Trillion Messages
- Programmatic Custom Model Creation - Introducing programmatic custom model creation with our Python SDK. (by Cohere)
- LLM-grounded Diffusion: Enhancing Prompt Understanding of Text-to-Image Diffusion Models with Large Language Models
- ChatDOC - Chat with documents. Get instant answers with cited sources.
- Made With ML - Join 40K+ developers in learning how to responsibly deliver value with ML!
- VectorAdmin: The universal interface for vector databases.. A production-ready vector database management system that doesn't hurt to use.
- Announcing OverflowAI - Let’s highlight the new features and products we announced today from the stage of WeAreDevelopers.
- 구글·오픈AI·마이크로소프트·앤트로픽, ‘프론티어 모델 포럼’ 창립
- 엔비디아, 생성AI 모델 훈련용 DGX클라우드 서비스 시작
- 클라우드만 선방한 삼성SDS…"연내 생성형 AI 출시"
- AWS·메타·MS 참여한 오버추어맵스재단, 오픈소스 지리 데이터 무료 공개
- 메타, 클라우드 사업자에 '라마2' 이용료 받는다
- 네이버, AI 지향점은 'B2B'…쏘카는 시작일 뿐
- 의료산업도 AI 전쟁터... MS·구글 이어 아마존도 참전
- Machine Learning & Deep Learning Tutorials
- LMs can serve as powerful engines to extract insights from your data.
- Everything you need to know to create a ChatGPT plugin
- Exciting news for the StarCoder cosmos!✨ The team just released new smaller StarCoder models for edge and on-device code generation - introducing the 1B, 3B and 7B models. 📱
- Creating an automated meeting minutes generator with Whisper and GPT-4
- A Context-based Chatbot Surpasses Trained Radiologists and Generic ChatGPT in Following the ACR Appropriateness Guidelines
- 생성형 AI, 더 새롭고 골치 아픈 섀도우 IT 시대를 열다
- Fine-Tune Your Own Llama 2 Model in a Colab Notebook(노트북
- **Instruction-Tuned Llama 2: Comprehensive Guide & Code** 🚀
- What We Know About LLMs (Primer)
- The economic potential of generative AI: The next productivity frontier
- “AI가 작성한 글 구별하기 아직 어려워”··· 오픈AI, AI 콘텐츠 탐지 도구 개발 중단
- 가능성과 호들갑 사이··· 챗GPT·LLM의 실제 비즈니스 가치는? 활용처는?
- 챗GPT 넘어라··· 다양한 LLM 활용이 필요한 때
- ‘선수 실시간 데이터 활용’… AI로 팬 경험 혁신한 스페인 축구 리그
- Stable Diffusion XL v1.0 🦒 Colab 🥳 Thanks to @StabilityAI ❤
- What is 𝗺𝗼𝗱𝗲𝗹 𝗿𝗲-𝘁𝗿𝗮𝗶𝗻𝗶𝗻𝗴 and how to implement it?
- Amazon OpenSearch Serverless용 벡터 엔진 미리 보기 출시
- 🌋 LLaVA: Large Language and Vision Assistant
- "거짓말도 사람만큼 잘한다" 생성형 AI, 소셜 미디어 흉내에 효과적
- Elastic vector dense field type and index vector
- pgvector - Open-source vector similarity search for Postgres
- JetBrains IDE의 AI Assistant
- QLoRA 기법으로 Falcon-40B 및 기타 대규모 모델(LLM)을 Amazon SageMaker Studio 노트북의 대화형 환경에서 파인튜닝하기
- 태빌리티AI, 오픈소스 LLM ‘프리윌리’ 출시
- Automating Web Research
- SparseEmbed: Learning Sparse Lexical Representations with Contextual Embeddings for Retrieval
- Combining DuckDB and PyArrow allows you to efficiently process datasets larger than memory on a single machine.
- ChatGPT has Never Seen a SINGLE Word (Despite Reading Most of The Internet). Meet LLM Tokenizers.
- TLDR: We successfully trained a Flamingo-Llama2-Chat7B on CC3M in less than 5 hours using just 4 A100s.
- Extended Guide: Instruction-tune Llama 2
- Announcing Jupyter Notebook 7
- New – Amazon EC2 P5 Instances Powered by NVIDIA H100 Tensor Core GPUs for Accelerating Generative AI and HPC Applications
- 1️⃣ AI for beginners - A 12-week, 24-lesson curriculum all about Artificial Intelligence. (by Microsoft)
- Llama 2 - Responsible Use Guide (by Meta)
- LLM-Reading-List - Just helping myself keep track of LLM papers that I‘m reading, with an emphasis on inference and model compression.
- How to Leverage Artificial Intelligence to Grow Your Business
- AI 윤리 모범답안 ‘데이터셋’ 공개한 네이버 이화란 팀장 “치우친 의견, 비윤리적 답은 위험 초래해”
- 데이터가 곧 가치인 시대, 성패는 데이터 품질에 달려있다
- Predicting Code Coverage without Execution
- vectordb - A Python vector database you just need - no more, no less.
- Do Efficient Training Algorithms / Optimizers really save us compute when training Transformer LMs? 🧐
- Complete Numpy Library
- ARB: Advanced Reasoning Benchmark for Large Language Models
- llama2-webui - Running Llama 2 with gradio web UI on GPU or CPU from anywhere (Linux/Windows/Mac).
- RLHF gets far more powerful as models get bigger
- GPT-4 System Card by OpenAI
- ARB: Advanced Reasoning Benchmark for Large Language Models
- Azure OpenAI Landing Zone reference architecture
- 💬🚀 LLM as a Chatbot Service
- Unraveling GPU inference costs for fine tuned open source models vs closed platforms
- ChatGPT broke the Turing test — the race is on for new ways to assess AI
- 나만의 GPT 만들기, Embedding
- LLM Censorship: A Machine Learning Challenge or a Computer Security Problem?
- tinyvector - the tiny, least-dumb, speedy vector embedding database.
- JAX Implementation of Llama 2
- CUDA Version Management
- 🌋 LLaVA: Large Language and Vision Assistant
- What We Know About LLMs (Primer)
- Parameters and Hyperparameters 101.
- llama2.c - With the code in this repo you can train the Llama 2 LLM architecture from scratch in PyTorch, then export the weights to a binary file, and load that into one ~simple 500-line C file (run.c)
- The case for 4-bit precision: k-bit Inference Scaling Laws
- Simplify Search with Multilingual Embedding Models
- What is LlamaIndex.TS?
- “AI 출시 전에 외부 보안 테스트” 구글ㆍMSㆍ오픈AI, 美 정부와 합의
- scale - Custom Open-Source LLMs. Fine-tune open-source large language models for improved performance on your most important use cases.
- ⚡ LLM Engine ⚡ - The open source engine for fine-tuning and serving large language models.
- How to Fine-Tune Llama 2 With LLM Engine
- Attention Is Off By One
- 글로벌 칼럼 | 마이크로소프트 365 코파일럿, 새로운 생산성 혁명의 시작
- 하이퍼클로바X·믿음… ICT업계, 하반기 빅테크에 반격 채비
- 네이버 뉴로클라우드 출격… 하반기 B2B AI대전 불붙는다
- 이제야 ‘생성형 AI’ 전쟁 참전한 애플, 늦었지만 늦지 않았다
- ‘그림자 아닌 빛으로’··· 시민 개발자·데이터 과학자 성공 사례 3가지
- 마이크로소프트, 자연어 인터페이스 구축을 위한 오픈소스 라이브러리 ‘타입챗’ 공개
- What is LangSmith and why should I care as a developer?
- What is Similarity Between Sentences?
- BTLM-3B-8K: 7B Performance in a 3 Billion Parameter Model
- Given the demand, here's the thread on deploying LLaMA 2 (or any open-source LLM of your choice!) using Hugging Face 🦙🧶
- Amazon-M2: A Multilingual Multi-locale Shopping Session Dataset for Recommendation and Text Generation
- Transformers: the Google scientists who pioneered an AI revolution
- Ollama - Run, create, and share large language models (LLMs).
- LLaMA2 isn't "Open Source" - and why it doesn't matter
- Codegen2.5 is only 7B parameters and matches starcoder on benchmarks which is double the size 15B.
- BoxDiff: Text-to-Image Synthesis with Training-Free Box-Constrained Diffusion
- ReLoRa: Pre-train a Large Language Model on Your GPU
- How to ensure 𝗗𝗮𝘁𝗮 𝗤𝘂𝗮𝗹𝗶𝘁𝘆 𝗶𝗻 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗦𝘆𝘀𝘁𝗲𝗺𝘀?
- ML project tip 🧠
- 🧠이해하기 쉽게 마이크로소프트가 설명해 주는 '코파일럿용 시맨틱 인덱스(Semantic Index for Copilot)🧠
- Qualcomm Works with Meta to Enable On-device AI Applications Using Llama 2
- The latest release of bitsandbytes has an improved CUDA setup and A100 4-bit inference.
- The Open Handbook of Linguistic Data Management
- 안드레 카파시의 도전: AGI
- Decoding the ACL Paper: Gzip and KNN Rival BERT in Text Classification
- Llama 2 x Function Calling API
- llama2.c compiled with Emscripten to run in a web page
- Hands-on MLOps - Train and Deploy a Real-Time ML model to predict crypto prices
- Lance - Modern columnar data format for ML. Convert from Parquet in 2-lines of code for 100x faster random access, a vector index, data versioning, and more.
- AI 코딩 동반자 Amazon CodeWhisperer 활용하는 4가지 방법
- There's a long-tail of advanced query techniques in RAG beyond top-k retrieval. 🔭
- How to Train Generative AI Using Your Company’s Data
- This repo contains GGML format model files for Meta's Llama 2 70B Chat.
- Faster PyTorch Training by Reducing Peak Memory (combining backward pass + optimizer step)
- 생성AI 잠재력을 더욱 키워줄 4가지 키워드
- Meta’s LLaMa 2 license is not Open Source
- 🧺 RAGstack - Deploy a private ChatGPT alternative hosted within your VPC.
- The Neurokernel Project aims to build an open software platform for the emulation of the entire brain of the fruit fly Drosophila melanogaster on multiple Graphics Processing Units (GPUs).
- The Curse of Recursion: Training on Generated Data Makes Models Forget
- The AI feedback loop: Researchers warn of ‘model collapse’ as AI trains on AI-generated content
- Mechanical Turk workers are using AI to automate being human
- OpenAI의 Function calling
- Meta's AI MusicGen makes music from text prompts
- I-JEPA: The first AI model based on Yann LeCun’s vision for more human-like AI
- About Infinigen - Infinigen is a procedural generator of 3D scenes, developed by Princeton Vision & Learning Lab.
- 🦾 OpenLLM - n open platform for operating large language models (LLMs) in production. Fine-tune, serve, deploy, and monitor any LLMs with ease.
- Voicebox: Text-Guided Multilingual Universal Speech Generation at Scale
- Introducing Voicebox: The first generative AI model for speech to generalize across tasks with state-of-the-art performance
- Official Repo of Tree of Thoughts (ToT)
- Tree of Thoughts: Deliberate Problem Solving with Large Language Models
- This startup gives your speech a new ‘human-realistic’ AI voice — for free
- LLaMA 2 - Every Resource you need
- Introducing new GitHub Copilot features in VS Code!
- Discover LlamaIndex: Key Components to build QA Systems
- RoboCat: A self-improving robotic agent
- “낙서를 멋진 그림으로” 스테이블 AI, 스테이블 두들 출시
- 마이크로소프트, ‘인스파이어 2023’ 개최… “AI 기반 기술 및 정책 대거 업데이트”
- 코파일럿 전략 가속화··· 마이크로소프트, 365 코파일럿 가격 공개 및 AI 영업 도구 추가
- AI 제조업 시대는 분명히 오겠지만.... '관건은 시기'
- "생성형 AI, 기업 IT 지출 영향 적지만 대비는 필요" 가트너 IT 지출 전망
- 애플도 부산하다…"내부에서 애플 GPT 가동 중"
- ML커먼스, 의료 AI 모델 정확도 평가 도구 ‘메디퍼프’ 공개
- MS 365 코파일럿 의 신규 가격 정책이 가져온 불길한 징조
- Why GPT-3.5 is (mostly) cheaper than Llama 2
- 'AI의 심장' 머신러닝 알고리즘의 이해
- AI 생산성의 최대 장벽은 사람이다
- 이제야 ‘생성형 AI’ 전쟁 참전한 애플, 늦었지만 늦지 않았다
- “AI 관련 공고 450% 급증” 채용시장 트렌드가 변한다
- 라즈베리 파이에서 Stable Diffusion 실행 (github.com/vitoplantamura)
- 🤗 Open LLM-Perf Leaderboard 🏋️
- Deploy large language models responsibly with Azure AI
- 네이버, AI 생태계 확장한다…일반·비즈니스 서비스 줄줄이 예고
- Meta and Qualcomm team up to run big A.I. models on phones
- If you’re building LLM apps over your data systems, there’s more uses to vector databases than you might think! 💡
- We are excited to announce the first major release of the Chatbot Arena conversation dataset!
- Boosted Llama V2 inference speed by 1.8x using @OpenAI's Triton (one key tech behind GPT-4) at batch=1 FP16 on a 3090 GPU, no quality compromises (-> no quant, etc.)
- No model has ever beaten 91% accuracy on ImageNet! Because this dataset has over 100,000 mislabeled images.
- Examples of using peft with trl to finetune 8-bit models with Low Rank Adaption (LoRA)
- Challenges and Applications of Large Language Models
- There is no one “performance” metric when building LLM apps for prod
- AlpacaEval : An Automatic Evaluator for Instruction-following Language Models
- Fast inference with vLLM (Llama 2 13B)
- Python library that adds Generative AI capabilities to Pandas🔥
- PandasAI is a Python library that adds Generative AI capabilities to pandas, the popular data analysis and manipulation tool.
- Android in the Wild (AitW) - Android in the Wild (AitW) is a large-scale dataset for mobile device control that contains human-collected demonstrations of natural language instructions, user interface (UI) screens, and actions for a variety of human tasks.
- MAPIE - Model Agnostic Prediction Interval Estimator
- Run Llama 2 Web UI on Colab or LOCALLY!
- text-generation-webui-colab
- imple prompting tricks help to improve Llama 2 (chat) performance massively ⚠️
- [AI 툴 추천] 효율적인 웹리서치를 위한 AI - Betterresearch.com
- Rerank can speed up an LLM query without sacrificing accuracy (and in fact, probably improving it). It does so by pruning away irrelevant nodes from the context.
- Introducing Semantic Kernel for Java
- Google Cloud expands availability of enterprise-ready generative AI
- Improving search experiences with Enterprise Search on Gen App Builder (by Google)
- Google Cloud Enterprise Search (by langchain)
- Many of us practitioners have felt that GPT-4 degrades over time. It's now corroborated by a recent study. But why does GPT-4 degrade, and what can we learn from it?
- brilliant - The best way to learn math and computer science
- LLM경쟁 점입가경...K-테크들도 정조준
- 통신3사 "AI투자 급한데 카르텔 논란 억울"
- 데이터 분석 예제 데이터 세트로 iris꽃을 대체하는 3종의 팔머 펭귄 데이터 다운로드가 백만을 넘어섰다고. :)
- How good is Llama 2 Chat? Key insights from our eval:
- MS, 파트너 컨퍼런스 ‘인스파이어 2023’ 개최… “AI 기술 및 정책 대거 업데이트”
- 메타·MS·퀄컴 '삼각동맹'… 오픈소스 전략으로 AI 판 흔든다
- Get started by selecting a learning path (by Google)
- LLAMA-v2 training successfully on Google Colab's free version! "pip install autotrain-advanced" 💥 Yes, you can also use your local machine!
- LLM을 활요한 연구분야 주제분석 실습 - ChatGPT API, Embeddings API, Pubmed API
- Fine-tune LLaMA 2 (7-70B) on Amazon SageMaker
- Apple Tests ‘Apple GPT,’ Develops Generative AI Tools to Catch OpenAI
- Train LLMs in just 50 lines of code!
- Meta LLM 패권 전쟁 격화시키다 : LlaMA2 상업적 이용가능 오픈소스로 공개
- uptrain - An open-source framework to evaluate and monitor LLM applications
- llama-2-13b-chat playground - public A 13 billion parameter language model from Meta, fine tuned for chat completions
- [챗GPT 러닝데이 | 한국어 LLM 민주화의 시작 KoAlpaca!
- Llama 2 foundation models from Meta are now available in Amazon SageMaker JumpStart
- 사실상 마지막 기회 맞은 카카오엔터프라이즈
- AI 속도조절 네이버 '큐' 사인 늦췄다
- AI 확산 속 신생 클라우드들이 급성장하는 비밀
- Text generation web UI - A gradio web UI for running Large Language Models like LLaMA, llama.cpp, GPT-J, OPT, and GALACTICA.
- Here's a short TL;DR on what Meta did to improve the state of the art 🧵
- How is ChatGPT's behavior changing over time?
- Llama 2: an incredible open LLM
- Diffusion Models Beat GANs on Image Classification
- The Practical Guides for Large Language Models
- You'll soon see lots of "Llama just dethroned ChatGPT" or "OpenAI is so done" posts on Twitter. Before your timeline gets flooded, I'll share my notes:
- The new Llama 2 model has an additional licensing requirement which prevents use if you have >700M MAUs, which is an oddly high number. OpenAI's ChatGPT hit 100 million MAUs in January, and has gone down since. It's essentially a "Amazon and Google don't use this k thx."
- Fine tune Llama v2 models on Guanaco Dataset
- M2 맥북의 GPU를 활용한 Jupyter Notebook 띄우기
- Llama 2: open source, free for research and commercial use
- Meet PolyLM (Polyglot Large Language Model): An Open Source Multilingual LLM trained on 640B Tokens, Available In Two Model Sizes 1.7B and 13B
- 허깅페이스와 LoRA를 사용하여 단일 Amazon SageMaker GPU에서 대규모 언어 모델(LLM) 훈련하기
- 대규모 언어 모델이 디지털 공공재에 위협이 될까요? (arxiv.org)
- AI Fundamentals: Datasets 101
- LMQL is a programming language for language model interaction.
- Building StarCoder, an Open Source LLM Alternative
- simpleaichat is a Python package for easily interfacing with chat apps like ChatGPT and GPT-4 with robust features and minimal code complexity.
- AI, ML, Data Engineering News Round Up: Vertex, AlphaDev, Function Calling, Gorilla, and Falcon
- 엔비디아 H100 GPU, AI 훈련 속도 가장 빠르다…MLPerf 벤치마크서 10분대 기록
- 미 FTC, 챗GPT의 유해성 조사…가짜 정보 유포 우려 제기
- The @FTC is investigating @OpenAI and the document outlining their questions is fascinating.
- IMF 출신 이창용 총재도 놀란 시각화 플랫폼···한은 ‘스냅샷’ 공개
- TOAST: Top-Down Attention Steering
- Remove Watermarks from Your Images for FREE
- 카카오브레인, 이미지 생성모델 Karlo 2.0 공개 (developers.kakao.com)
- Open-Source Text Generation & LLM Ecosystem at Hugging Face
- '챗GPT' 업무에 적용한 교보생명..."디지털 전환 역량 강화"
- Learning to Retrieve In-Context Examples for Large Language Models
- Every major AI nails the Voight-Kampff test.
- Learning an embedding with the kernel trick using GZIP
- BEIR is a heterogeneous benchmark containing diverse IR tasks. It also provides a common and easy framework for evaluation of your NLP-based retrieval models within the benchmark.
- Weeknotes: Self-hosted language models with LLM plugins, a new Datasette tutorial, a dozen package releases, a dozen TILs
- At Jabbr we've poured our heart and soul into building the world's first Computer Vision AI for combat sports — we call it: DeepStrike
- How to integrate custom LLM using langchain. A GPT4ALL example.
- Deploy models painlessly
- TSlib is an open-source library for deep learning researchers, especially deep time series analysis.
- Are Vector Databases here to stay? 🔍 Yes, it seems LLMs are lost in the Middle and lost focus on long inputs.🗺👁🗨
- How to Use AI to Do Stuff: An Opinionated Guide
- How to test ML models in the real world
- embeddings: introduction - This course is about embeddings, mainly the intuition behind them.
- 9 Distance Measures in data science with algorithms.
- 🔘 MIT Deep Learning in Life Sciences
- Awesome MLOps
- 하드웨어
- 삼성전자 "HBM 생산능력, 최소 2배 이상 증설중"
- iOS 17 베타 4 코드로 짐작하는 아이폰 15 프로 ‘동작 버튼’의 9가지 역할
- 아이패드가 ‘마침내’ 노트북을 대체할 수 있게 된 이유
- "울트라 이더넷 만든다" AI 인프라용 네트워크 표준 위해 컨소시엄 결성
- 가민 포러너 255S 리뷰 | 철인 3종 경기에도 적합한 ‘가성비’ 스포츠 워치
- 엔비디아에서 AMD 그래픽 카드로 바꾼 이유 4가지
- Mali GPU Training
- Putting the “You” in CPU
- When Open Becomes Opaque: The Changing Face of Open-Source Hardware Companies
- 다가오는 양자 컴퓨팅 시대, 기업이 알아야 할 '양자 어닐링'
- ‘AI, 암호화폐, 메타버스까지…’ 엔비디아가 시총 1조 달러를 넘어서기까지
- Fine-tuning is the new training. Here are 2 open-source Python libraries to help you 🐍↓
- Chapyter is a JupyterLab extension that seamlessly connects GPT-4 to your coding environment.
- My First Immersion in Apple Vision Pro: Heavy, Man!
- Insights from a laboratory fire
- GN⁺: EU, 모든 스마트폰에 교체 가능한 배터리를 의무화하는 규정에 공식적으로 동의 (androidauthority.com)
- 읽을거리
- 재난의 그늘 - “과중한 업무·책임만 강요…재난 전문가 되기 전에 다 떠나”
- 부산광역시에서 직접 제작한 부산 맛집 지도
- 49세에 퇴직하지만… 고령층 “73세까지 일하고 싶다”
- "상대의 의견은 공격하되 사람은 공격하지 않는다." ㅡ루스 긴즈버그(미국 연방대법관)
- 크리에어터나 인풀루엔서가 되고 싶다면 필독해야 되는 인터뷰:
- 짜증나는 유튜브 '그 게임', 이제 진짜 해볼 수 있다 - "돈 주고 플레이하는 행위 자체가 개그"
- "좌식시간 세계 최장 한국인…신체활동은 선택 아닌 필수"
- 비행기 뜬지 1시간만에 '펑'…111명 목숨 앗아간 최악의 이 사고
- 휴·폐업 급증에 부실률 치솟아…위탁보증 예산 고갈 3년 빨라져
- "독자도, 저자도 출판사로 모여요" 출판사의 변신은 무죄
- 어떤 폰 써? "갤럭시 69%, 아이폰 23%"…20대는 '정반대'
- 원격의료 결국 탈났다 플랫폼 4곳 운영 중단
- 국내 여행 때 ‘현지인 맛집’을 찾기 위해 쓰는 방법
- 2022년 기준 한국 출판 생산 통계
토요일, 7월 29, 2023
[B급 프로그래머] 7월 4주 소식(빅데이터/인공지능, 하드웨어, 읽을거리 부문)
금요일, 7월 28, 2023
[독서광] 슬기로운 파이썬 트릭
이번 주는 슬기로운 파이썬 트릭를 소개하겠다.
방송 스크립트는 전체 공개되어 있으며, 슬라이드셰어에서 보거나 다운로드 받을 수도 있다.
하이라이트를 요약 정리하면 다음과 같다:
- 00:00 도입
- 00:49 한 페이지 요약
- 02:20 이 책의 목차
- 03:40 무엇이 이 책을 흥미롭게 만드는가?
- 07:58 책 vs 책
- 09:16 대상 독자
- 10:06 결론과 마무리
토요일, 7월 22, 2023
[B급 프로그래머] 7월 3주 소식(개발/설계/경력관리/보안/클라우드/데이터베이스 관련 소식 정리)
(오늘의 짤방: Code Completion saving us all via @PR0GRAMMERHUM0R)
개발 관련 소식
- 팁과 유틸리티
- “아이폰을 스마트 홈 허브로” iOS 17의 스탠바이 모드 사용법
- 마이크로소프트, 윈도우 11 작업 표시줄 시계 ‘초 단위’ 표시 기능 정식 배포
- 프로그램·파일 건드리지 않고 재설치?!··· 윈도우 11 프리뷰의 신기능
- “맥OS 소노마 화제의 신기능” 바탕화면 위젯을 설정하는 방법
- 구글, 윈도우용 니어바이 셰어 정식 버전 출시
- A 17th-century font in a 21st-century thesis
- CURL 8.2.0
- “출시 초기에는 못 쓴다” 연말 이후 누릴 수 있는 iOS 17 기능 5가지
- 날씨 앱이 말하는 "비 올 확률 20%"의 의미
- A change of typeface: Microsoft’s new default font has arrived
- 애플 워치로 가능한지 몰랐던 10가지 유용한 기능
- SlideShare에 올려둔 발표자료를 Speaker Deck으로 가져올 수 있는 기능(베타, 얼리 엑세스)이 출시.
- komorebi - Tiling Window Management for Windows.
- 프로그래밍
- Python's raise: Effectively Raising Exceptions in Your Code
- Profiling in Python: How to Find Performance Bottlenecks
- 매력적인 프론트 엔드를 만드는 파이썬 웹 프레임워크 3가지
- Adding tail call optimization to Python
- Diagrams lets you draw the cloud system architecture in Python code.
- Speeding Up Python with Concurrency, Parallelism, and asyncio
- OAuth - How does it Work?
- Docker best practice: Use multistage builds to reduce the size of the production image.
- Error-Message Guidelines
- Top 20 Must-Read Software Trends Reports for 2023(주기적으로 점검!)
- A collection of Bash scripts for automating routine tasks and streamlining your workflow.
- 10 Best Linux Commands Tutorials
- 실무에서 많이 사용되는 터미널 (terminal) 작업 모음-1부
- Android, iOS 웹뷰에서 딥링크 열기- 토스
- Benchmarking Python and Rust Async Web Server Performance
- New zine: How Integers and Floats Work
- Welcome to Memory Spy! - Ever wish you could see the actual bytes used to represent your variables?
- Too Much JavaScript? Why the Frontend Needs to Build Better
- WebAssembly runtimes will replace container-based runtimes by 2030
- Securing Spring Boot Applications With SSL
- Docker Compose Support in Spring Boot 3.1
- Resolve Encoding Issues of Resource Files in Java Projects
- Three Ways to Run Your Java Locally with HTTPS
- Exploring Java Records beyond Data Transfer Objects
- Java is Very Fast, If You Don’t Create Many Objects
- Nulls Against Collectors
- Class Loader Hierarchies
- 제품을 바닥부터 다시 만들게 된다면 꼭 지킬 것들 (hiddenest.dev)
- Penrose 3.0 릴리즈 (penrose.cs.cmu.edu)
- Typst is a new markup-based typesetting system that is designed to be as powerful as LaTeX while being much easier to learn and use.
- Explaining JSON Web Token (JWT) to a 10 year old Kid.
- JDK Mission Control 8.3 - Sip of Java
- Objects Utility Class - Sip of Java
- Exploring Java 21’s Intriguing Additions: Unveiling New Features (Part 1)
- 게임회사들은 "어떤"게임 엔진을 "왜"사용할까? 언리얼 vs 유니티 (UE vs Unity) v2023.7 - 2편
- Structured Concurrency in JDK 21: A Leap Forward in Concurrent Programming
- Learn how to use SSH Tunnels in practice 🔽
- Free 10 week Python course 2023.
- 배치개발이 쉬운건가요?
- Difftastic is a structural diff tool that compares files based on their syntax.
- Permutations of a String in C#
- How To Parse String to DateTime in C#
- Celebrating 20 Years of WordPress
- How to Use Dependency Injection with Node.js
- GitHub Merge Queue 일반 공개 (github.blog)
- How to Build Docker Image : Comprehensive Beginners Guide
- 찻잔 속 태풍··· 레드햇을 향한 질타가 그들만의 목소리인 이유
- I have written a JVM in Rust
- GN⁺: 맥에서 리눅스 가상 머신을 실행하는 좋은 방법: Lima (jvns.ca)
- 90년대 개발자 스타터팩 (retrocoding.net)
- #include cleanup in Visual Studio
- GN⁺: 대부분의 클래식 비디오 게임이 이용 불가능한 것으로 밝혀진 새로운 연구 (gamehistory.org)
- ex-구글러를 위한 개발도구 가이드 (about.sourcegraph.com)
- Clean Code, is it really worth it?
- CS106A - Programming Methodology by Stanford
- PEP 703이 억셉트 되면, Meta는 no-GIL CPython에 3년간 엔지니어를 투입할 예정 (discuss.python.org)
- Java Collections Cheat Sheet
- implement DNS in a weekend
- TOML - 사람을 위한 Config 파일 포맷 (toml.io)
- DevOps
- AWS Copilot is an open source command line interface that makes it easy for developers to build, release, and operate production ready containerized applications on AWS App Runner, Amazon ECS, and AWS Fargate.
- 쿠버네티스 초보 탈출 소감: 🐣
- Werf: Pioneering the Future of CI/CD — A Close Look at the CNCF’s Noteworthy Addition to the DevOps Landscape
- Structured Logging
- 아카마이, 데이터센터 POP 3곳 개소 “퍼블릭 클라우드 공략 가속화”
- Roblox의 모든 개발자들에 발등에 불똥이 떨어진 73시간 동안 개발팀에겐 어떤 일이 있었을까요? Roblox 개발팀이 직접 공개한 흥미진진한 장애 부검 요약:
- NGINX and the “Power of Two Choices” Load-Balancing Algorithm
- Kubernetes logging best practices
- Did you know you can now use ngrok without even installing ngrok? 😱
- Docker best practice: Use array over string syntax in your Dockerfiles to handle signals properly
- kafka-in-production - A GitHub repo of presentations by companies running Kafka in production
- Sublinear Scaling in Practice: The 1k SRE Project
- Open sourcing the nginx playground
- 설계
- LinkedIn Adopts Protocol Buffers for Microservices Integration and Reduces Latency by up to 60%
- The big picture: How Google Photos scaled rapidly on Spanner
- 광고 시스템 퍼포먼스 튜닝 회고록
- Monoliths, Microservervices and Mainframes – Reflections on Amazon Prime Video’s Monolith Move
- Why Your OpenAPI Spec Sucks
- Technical Debt is over-used
- What is API documentation?
- How to build microservices
- Micro-frontend Migration Journey – Part 1: Design
- Improving Performance with HTTP Streaming
- How do you build resilient systems that prevent system misuse and resource overload?
- 소프트웨어 개발의 가장 어려운 점은 코딩이 아니라 요구사항 (stackoverflow.blog)
- How DoorDash Designed a Successful Write-Heavy Scalable and Reliable Inventory Platform
- 경력 관리와 개발문화
- The Cloud Resume Challenge: My Journey into the Cloud
- "한 달 일해도 500만원 못 번다"…공공 SW 개발자의 한탄
- [CTO 인터뷰] 조직문화를 만드는 건 결국 사람입니다
- 의견 불일치의 계층 (Graham's hierachy of disagreement)
- Maximizing Developer Effectiveness
- Can DevEx Metrics Drive Developer Productivity?
- IT 리더가 알아야 할 레거시 기술의 가치 ‘지속성’
- 올바른 성장을 위한 여정
- 대학생 때 알았더라면 좋았을 것들 (2023 Ver)
- 앱스토어 1위 후 DAU가 10토막이 나버렸고 대표는 빚이 생겼다
- Fast! - 단시간에 완성된 프로젝트들 사례 (patrickcollison.com)
- GN⁺: 아마추어들은 도구에 집착하고, 전문가들은 숙련에 집착한다. (adamsinger.substack.com)
- [요즘IT] 가입자 1천만 명 ‘미리캔버스’, 유료 구독 개발 비하인드
- 연봉 1억 보장→3500만원… ‘개발자 우대’ 옛말 된 까닭
- 탁월함은 습관이지만, 실패도 마찬가지
보안/클라우드/데이터베이스 관련 소식
- 보안
- 개인정보 분쟁사례 완전 정복
- “아이폰과 암호를 모두 도난 당했을 때” 내 정보 지키는 최후의 보루 ‘스크린 타임’
- ‘NAS, VPN 게이트웨이 外’... 포어스카우트가 뽑은 취약 엔터프라이즈 장치 20개
- Amazon EC2부터 서버리스 컴퓨팅까지, AWS 컴퓨팅 서비스 알아보기
- 깃허브서 가짜 PoC 발견돼… “개념증명으로 위장한 데이터 탈취용 백도어”
- “또 털렸어?”··· 가상자산 지갑 잇단 보안 사고에 몸살
- Topics API - Enable interest-based advertising, without having to resort to tracking the sites a user visits.
- Web Check
- The art of fuzzing: Windows Binaries
- ShellGhost - A memory-based evasion technique which makes shellcode invisible from process start to end.
- Using encryption to verify a license key
- Understanding SameSite cookies
- 오픈소스 PDF 라이브러리인 Ghostscript에서 치명적인 RCE 취약점이 발견됨 (bleepingcomputer.com)
- “진상 조사로 시간 끌고 문서화하지 말라” 보안 사고에 대한 변호사 조언이 위험한 이유
- “크립토마이너 ‘스칼렛틸’, 이제 컨테이너 자격증명까지 훔친다” 시스딕
- AWS SSM으로 EC2 인스턴스에 접근하기 (SSH 대체)
- Decrypt Chrome Passwords
- Firefox Decrypt
- 클라우드
- "하이퍼스케일러가 전체 데이터 용량의 37%··· 5년 후에는 50% 차지"
- AWS Data Migration Service(DMS)를 활용하여 Amazon Aurora PostgreSQL 블루/그린 배포 환경 생성하기
- Amazon RDS MySQL 블루/그린 배포 환경에서 Amazon Route 53을 활용한 운영환경 읽기 쿼리 분산
- 사용법과 함께 작성해본 좌충우돌 AWS DMS 사용기 - feat. RDS 통합 이야기
- 클라우드 서비스의 가치를 매기는 방법
- 수제 FinOps - Lambda편
- 클라우드 오토스케일링의 함정 4가지
- 𝗛𝗼𝘄 𝗖𝗮𝗻𝘃𝗮 𝘀𝗮𝘃𝗲𝘀 𝗺𝗶𝗹𝗹𝗶𝗼𝗻𝘀 𝗮𝗻𝗻𝘂𝗮𝗹𝗹𝘆 𝗶𝗻 𝗔𝗺𝗮𝘇𝗼𝗻 𝗦𝟯 𝗰𝗼𝘀𝘁𝘀
- Clickstream Analytics on AWS – 모바일 및 웹 앱에서의 고객 클릭 수집 및 감지하기
- Is Aurora PostgreSQL really faster and cheaper than RDS PostgreSQL – Benchmarking
- IDC “지난해 퍼블릭 클라우드 지출, 700조 넘어섰다”
- 데이터베이스
- How to choose Database
- Postgres vs. MySQL: a Complete Comparison in 2023
- Postgres Full Text Search is better than ... (Part 1)
- The basics of the InnoDB undo logging and history system
- The best way to use one-to-one table relationships
- Kanel - PostgresSQL 에서 Typescript types 생성하기 (github.com/kristiandupont)
- 개발자의 시간을 대폭 줄이는 통합형 오픈소스 시계열 데이터베이스 : Machbase Neo (github.com/machbase)
- PostgreSQL Vacuum에 대한 거의 모든 것
- Database abstractions for Golang
- Distributed Locks with Postgres (Advisory Locks) and Knex.js
- Cloud Backed SQLite (CBS) (sqlite.org)
(보너스: Job Demand - Control - Support Model 인데, 어떻든 support(동료간 지지)와 control(업무재량권)이 높으면 건강한 일터가 될 수 있다는 얘기. 번아웃 예방에도 중요. 여기서 support는 오직 사람(관계)로 할 수 있는 것. via @and_awarelab)
EOB토요일, 7월 15, 2023
[B급 프로그래머] 7월 2주 소식(빅데이터/인공지능, 하드웨어, 읽을거리 부문)
(오늘의 짤방: Switching to a 𝗠𝗟𝗢𝗽𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿 role might be easier than you think. via @Aurimas_Gr)
- 빅데이터/인공지능
- An Intro to Prompting and Prompt Engineering
- Running Large Language Models locally – Your own ChatGPT-like AI in C#
- AI is a fad and programming is dead
- 구글, '노트북LM' 발표··· "정보 유출 우려 없이 AI 활용"
- “40개 언어로 답하고 이미지도 분석한다” 구글 바드 업데이트
- 앤트로픽, 클로드 2 출시…또 하나의 챗GPT 대항마 기대
- “M365 코파일럿의 모든 것” MS의 생성형 AI 도구 종합 안내서
- State of AI Development: 34000% growth in AI projects, OpenAI's dominance, the rise of open-source, and more
- GPT4All supports generating high quality embeddings of arbitrary length documents of text using a CPU optimized contrastively trained Sentence Transformer.
- The Problem With LangChain
- Gzip + kNN beats transformers on text classification.
- 하나금융, 금융판 챗GPT만든다...자체 거대언어모델 개발
- ML gpu model server 성능을 유지하며 cpu server로 전환한 경험 공유
- 🚀This is incredible - web scraping with LLM🚀
- AI Companion App (based on AI Getting Started template)
- Anthropic, Claude 2 언어 모델 공개 (anthropic.com)
- Analyzing User Interactions with LLMs to Improve our Documentation LangChain
- kNN using a gzip-based distance metric outperforms BERT and other neural methods for OOD sentence classification
- A Survey of Large Language Models
- GN⁺: GPT-Prompt-Engineer - GPT 프롬프트 엔지니어 (github.com/mshumer)
- AI, 서버 시장도 흔들었다⋯ “출하량 줄고 가격 급등”
- 유아이패스, 생성형 AI 및 전문 AI 기능 소개
- 치열해지는 클라우드 및 SaaS 시장··· 오라클의 생성형 AI 전략
- 챗GPT! 대화형 AI챗봇에 꼭 필요한 4가지 인터랙션
- "돈은 많은데 좋은 데이터가 없다"...생성AI 스타트업 '고심'
- “책 한 권 분량의 긴 질문 입력 가능”··· 앤트로픽, 차세대 AI 모델 ‘클로드 2’ 공개
- 생성형 AI·LLM 실험의 좋은 출발점··· 오픈소스 NLP 도구 3가지
- Amazing graphic notes on Gilbert Strang's "Linear Algebra for Everyone" book.
- My LLM CLI tool now supports self-hosted language models via plugins
- 서비스에 chatGPT를 붙여보았다
- Open LLMs - These LLMs(Large Language Models) are all licensed for commercial use (e.g., Apache 2.0, MIT, OpenRAIL-M).
- Lessons and learnings from building an enterprise-ready AI assistant
- QA and Chat over Documents
- 오아시스비즈니스, 매출 예측 모델 ‘델파이’ 출시
- Claude-2, Anthropic's ChatGPT competitor was just released and it's incredible.
- 구글 Machine Unlearning Challenge (ai.googleblog.com)
- Vector Search Isn’t Enough
- A guide for Machine Learning Technical Interviews
- 구글, AI 연구를 위한 robots.txt의 보완 프로토콜 공개토론 시작 (blog.google)
- 웹 개발자를 위한 50가지 이상의 ChatGPT 프롬프트 [번역] (velog.io)
- 오픈AI, 초지능 AI 견제할 부서 신설한다 “새 감독 기술 개발”
- ‘RPA에 AI 더하기’··· IA 선도 기업 3곳의 조언
- I'm calling the Myth of Context Length:
- Document-Oriented Agents: A Journey with Vector Databases, LLMs, Langchain, FastAPI, and Docker
- LangChain은 무의미합니다 (old.reddit.com)
- Deduplication - 학습 데이터에서 중복 제거하기
- 100+ 팀원의 의사결정에 영향을 주는 Data Scientist, Decision
- vlite - numpy로 만든 간단한 벡터 데이터베이스 (github.com/sdan)
- 생성AI와 LLM으로 생산성을 높이는 방법 - Cohere
- OpenAI plans to shut down access to older models in January 2024.
- InternLM - 오픈소스 7B 파라미터 언어 모델 (github.com/InternLM)
- GPTCache : A Library for Creating Semantic Cache for LLM Queries
- LangChain: Chat with Your Data 무료 강의[1시간] (deeplearning.ai)
- Lost in the Middle: How Language Models Use Long Contexts
- GPT-4 API를 일반적으로 사용할 수 있습니다. (openai.com)
- AI Engineer의 부상 (docs.google.com)
- “하나의 모델이 만능은 아니다” 챗GPT를 대체할 만한 14가지 LLM
- 신규 비디오: ChatGPT를 운영하는데 무엇이 필요할까요?
- LlamaIndex 🦙 - Recursive Retriever + Query Engine Demo
- symbex - Find the Python code for specified symbols
- Machine Learning Notebooks, 3rd edition
- 마침내 동트는 ‘AI 기반 지식 관리’ 시대
- 마이크로소프트 올리브를 통해 가속화된 NPU용 AI 앱 구축하기
- Introducing Superalignment by OpenAI
- Why is 𝗠𝗼𝗱𝗲𝗹 𝗥𝗲𝗴𝗶𝘀𝘁𝗿𝘆 so important in your 𝗠𝗟𝗢𝗽𝘀 𝗦𝘁𝗮𝗰𝗸?
- Torchmetrics v1.0: Visualize model performance with 100+ metrics
- The PromptCraft-Robotics repository serves as a community for people to test and share interesting prompting examples for large language models (LLMs) within the robotics domain.
- 고성능 ML 백엔드를 위한 10가지 Python 성능 최적화 팁
- Tabnine Chat 베타 공개 (tabnine.com)
- CBInsights의 2023년 가장 유망한 AI 스타트업 100 (cbinsights.com)
- Improve ChatGPT with Knowledge Graphs
- Transformers Meet Directed Graphs
- composer - A PyTorch Library for Efficient Neural Network Training
- LLM Foundry - This repository contains code for training, finetuning, evaluating, and deploying LLMs for inference with Composer and the MosaicML platform.
- 네카오, 챗GPT 대응 '경쟁보단 특화'
- Let's Do a Thought Experiment: Using Counterfactuals to Improve Moral Reasoning
- ‘AI’와 관련된 잘못된 생각
- 윈도우 코파일럿 리뷰 | 단순 빙챗? 혹은 그 이상? 아직은 혼란한 AI 비서
- ChatGPT took their jobs. Now they walk dogs and fix airconditioners.
- Hugging Face Presents HuggingChat, Open Source Alternative to ChatGPT
- 팀의 다양성을 확보해 ‘더 나은 데이터’를 얻는 법
- 내 일자리는 어떻게 변화하는가··· AI 시대 ‘일자리’ 전망
- GPT-Migrate - 프레임워크/개발언어를 변경해주는 도구 (github.com/0xpayne)
- XrayGPT: 메디컬 비전-언어 모델(VLM)을 이용한 흉부 방사선 사진 요약 (github.com/mbzuai-oryx)
- Demystifying GPT Self-Repair for Code Generation
- So where are we all supposed to go now?
- Amazon Kendra, LangChain 및 대규모 언어 모델(LLM)을 사용하여 엔터프라이즈 데이터에서 높은 정확도의 생성형 AI 애플리케이션을 빠르게 구축하기
- OpenOrca - 데이터셋 & 인스트럭션 튜닝된 언어모델 오픈소스 (huggingface.co)
- What does an 𝗘𝗳𝗳𝗲𝗰𝘁𝗶𝘃𝗲 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗘𝘅𝗽𝗲𝗿𝗶𝗺𝗲𝗻𝘁𝗮𝘁𝗶𝗼𝗻 𝗘𝗻𝘃𝗶𝗿𝗼𝗻𝗺𝗲𝗻𝘁 look like?
- Hugging Face — Object Detection using Pre-Trained Models
- A Survey on Multimodal Large Language Models
- Stability AI, 연구용도의 디퓨젼 모델 2개 공개 (github.com/Stability-AI)
- OpenFlamingo V2 릴리즈 (laion.ai)
- LLM 어플리케이션을 위한 새로운 아키텍쳐 (a16z.com)
- 하버드, 전산학 입문 과정에 AI를 도입할 것 (independent.co.uk)
- Gödel, Escher, Bach author Doug Hofstadter on the state of AI today
- Camelot: PDF Table Extraction for Humans
- Switching to a 𝗠𝗟𝗢𝗽𝘀 𝗘𝗻𝗴𝗶𝗻𝗲𝗲𝗿 role might be easier than you think.
- What Will AI Do to Your Job? Take a Look at What It’s Already Doing to Coders
- 100-Days-Of-ML-Code - 100 Days of Machine Learning Coding as proposed by Siraj Raval
- The Rise of the AI Engineer
- 하드웨어
- 읽을거리
수요일, 7월 12, 2023
[독서광] 유혹하는 글쓰기
이번 주는 유혹하는 글쓰기를 소개하겠다.
방송 스크립트는 전체 공개되어 있으며, 슬라이드셰어에서 보거나 다운로드 받을 수도 있다.
하이라이트를 요약 정리하면 다음과 같다:
- 00:00 도입
- 00:34 한 페이지 요약
- 02:54 이 책의 목차
- 04:34 무엇이 이 책을 흥미롭게 만드는가?
- 09:05 대상 독자
- 09:36 결론과 마무리
목요일, 7월 06, 2023
[B급 프로그래머] 7월 1주 소식(개발/설계/경력관리/보안/클라우드/데이터베이스 관련 소식 정리)
(오늘의 짤방: Where's the closing tag? via @iammemeloper)
개발 관련 소식
- 팁과 유틸리티
- 프로그래밍
- 로그 쓰기, 보기, 응답하기
- Reflex (Pynecone) - Part 1(소개: Python기반의 Full Stack Framework)
- Rust Development with Testcontainers
- 죽은 앱을 되살리기 (with ASO: App Store Optimization) (threadreaderapp.com)
- BlockNote - Notion과 비슷한 블록기반 리치텍스트 편집기 오픈소스 (blocknotejs.org)
- 오픈소스 웹 테스트, 자동화 라이브러리 Playwright 소개
- DocBase - DocSend의 오픈소스 대체제 (github.com/alanagoyal)
- million - React를 70% 빠르게 (million.dev)
- Myths Programmers Believe about CPU Caches
- 1899-12-31T23:27:52.000+08:27:52의 정체
- C# logging: Best practices in 2023 with examples and tools
- What's the Right Authorization Model for My Application?
- Using Async-Profiler and Jattach Programmatically with AP-Loader
- Getting Started with Eclipse Collections — Part 4
- The Power of Precise Names: An Example
- Is Podman a Drop-in Replacement for Docker?
- Deploying apps with JCEF
- Spring Boot Debugging with Aspect-Oriented Programming (AOP)
- Patterns: Exhaustiveness, Unconditionality, and Remainder
- JavaFinder: Keeping Track of Java Inventories
- Avoiding Pitfalls With Java Optional: Common Mistakes and How To Fix Them [Video]
- Unleashing the Power of Lightweight Concurrency: A Comprehensive Guide to Java Virtual Threads (Part 1)
- Formatting Inlined @value in Javadocs
- The Basis of Virtual Threads: Continuations
- Java Concurrency: Condition
- Java String Templates
- Breaking down Barriers: Introducing JDK 21’s Approach to Beginner-Friendly Java Programming
- Java Gets a Boost with String Templates: Simplifying Code and Improving Security
- Cash - 초경량 jQuery 대체 라이브러리 (github.com/fabiospampinato)
- Code coverage in Rust
- 기술 스택 선정 고민 : Vite vs Next.js
- 미래의 CSS: State Container Queries (ishadeed.com)
- [독서광] Docs for Developers 기술 문서 작성 완벽 가이드(본인이 작성한 글)
- 메타의 개발자 도구들: 대규모로 작업하기 (engineering.fb.com)
- Awk 프로그래밍 언어, 제2판 (awk.dev)
- 동시성, 병렬, 비동기, 논블럭킹과 컨셉들
- “개발자가 수학에 투자하는 시간은 절대 낭비가 아닙니다” C++ 창시자 인터뷰
- Learn jq the Hard Way, Part I: JSON
- [Software Architecutre Pattern 01] Software Design 원칙 SOLID 알아보기
- Here's a tiny set of questions that will help you generate unit tests that will actually prevent bugs.
- Learning Linux Kernel Exploitation - Part 1
- Learning Linux Kernel Exploitation - Part 2
- Learning Linux Kernel Exploitation - Part 3
- DevPod is infrastructure-independent and client-only, which makes it incredibly easy to get started with.
- Development Containers - An open specification for enriching containers with development specific content and settings.
- Make your programs run faster by better using the data cache
- 모든 자바스크립트 개발자가 알아야 할 33가지의 컨셉
- DevOps
- 설계
- 경력 관리와 개발문화
- 주니어의 스터디 드라이븐 성장기 (발표자료 & 스크립트) (present.do)
- 때로는 빠른 해고가 답··· 말썽꾼 IT 직원 유형 8가지
- How Async Practices Can Lead To Better Decision Making
- Technical KPI Playbook for Engineering Success
- Who killed Google Reader?
- 대기업·IT 기업 3분기 채용 활발··· “대퇴직 아닌 대규모 재편”
- Building a Startup from Scratch: My Mistakes as CTO
- 인프런 대표의 업계 시황 분석
- 1:1 미팅이 리더의 핵심 활동이어야 하는 이유
보안/클라우드/데이터베이스 관련 소식
- 보안
- WAS의 정보는 개인정보 다루듯이 보호하라
- the Pudding provides a taxonomy of dark patterns: unethical tricks that companies use to prevent you from canceling online subscriptions.
- Apple and Google lead initiative for an industry specification to address unwanted tracking
- “공격 캠페인 50% 이상은 방어 회피에 초점” 아쿠아 시큐리티 보고서
- Hetty - 보안 연구를 위한 오픈소스 HTTP 툴킷 (github.com/dstotijn)
- "모든 애플 기기, 지금 바로 업데이트해야" 애플, 10년 전 기기까지 긴급 보안 패치
- “구글과 리프트 포함한 기업의 깃허브 저장소, 리포재킹 공격에 취약”
- 국정원 “北, 본인인증 프로그램 ‘매직라인’ 취약점 뚫고 해킹시도”
- 클라우드
- 데이터베이스
보너스: ✅ Python Programming Mind Map via @brijpandeyji
EOB토요일, 7월 01, 2023
[B급 프로그래머] 6월 5주 소식(빅데이터/인공지능, 하드웨어, 읽을거리 부문)
(오늘의 짤방: Without engineering, there is no science. via @paulabartabajo_)
- 빅데이터/인공지능
- GPTZero vs Turnitin 🤺
- Introducing Lamini, the LLM Platform for Rapidly Customizing Models
- Brain scans can translate a person’s thoughts into words
- Prompt injection explained, with video, slides, and a transcript
- Google Cloud advances generative AI at I/O: new foundation models, embeddings, and tuning tools in Vertex AI
- Vector Databases: Long-Term Memory for Artificial Intelligence
- Why Chatbots Are Not the Future
- LangChain AI Handbook
- What is low-rank adaptation (LoRA)?
- https://medium.com/@brian_90925/llms-and-the-emerging-ml-tech-stack-6fa66ee4561a
- Nodepad is a web application for brainstorming, note taking, and exploring ideas using large language models.
- Observability, Meet Natural Language Querying with Query Assistant
- Inflection AI, The Year-Old Startup Behind Chatbot Pi, Raises $1.3 Billion
- 그때 그 시절 추억의 ‘클리피’, AI 앱으로 돌아왔다
- 구글 및 엔비디아, AI 영상 생성 업체 ‘런웨이’에 1억 4,100만 달러 투자
- 화장품 기업 벨코프, AI로 R&D를 완전히 재구성하다
- 주요 IT 벤더의 생성형 AI 솔루션 살펴보기
- Who Owns the Generative AI Platform?
- For B2B Generative AI Apps, Is Less More?
- Why AI Will Save the World
- The Next Token of Progress: 4 Unlocks on the Generative AI Horizon
- 생성형 AI 도입을 위해 CIO가 점검해야 할 7가지 질문
- 데이터브릭스, 생성형 AI 업체 ‘모자익ML’ 1조원에 인수
- embedchain - 아무 데이터셋을 이용한 LLM 기반 봇 만들기 (github.com/embedchain)
- Leap - Add AI to your app in minutes
- 래리 엘리슨 오라클 회장 "올해 엔비디아 GPU 구입에 수십억달러 투입"
- 몽고DB, AI로 데이터베이스 혁신
- 챗GPT 도입 공공선 사실상 불가능...국정원, 네이버·KT K-초거대 AI 민다
- How Long Can Open-Source LLMs Truly Promise on Context Length?
- OpenAI, ChatGPT '업무용 개인 비서'를 출시할 계획으로 마이크로소프트와 라이벌 구도를 형성할 수도 (theinformation.com)
- “API 개발자 사이에서도 생성형 AI 도구가 대세” 포스트맨 보고서
- Massive cost saving (by 50% or more 💵📷) of your ChatGPT API call by using caching with @LangChainAI and GPTCache Integration.
- Custom functions with OpenAI Functions Agent
- DeepSpeed ZeRO++ : 통신량을 4배 줄이면서 LLM과 채팅 모델 트레이닝 속도의 획기적인 향상 (microsoft.com)
- 세계 최초로 채택된 유럽연합 ‘AI법’에서 주목할 5가지 (technologyreview.kr)
- Pandas 2.0: A Game-Changer for Data Scientists?
- How is 𝗖𝗜/𝗖𝗗 𝗽𝗿𝗼𝗰𝗲𝘀𝘀 𝗱𝗶𝗳𝗳𝗲𝗿𝗲𝗻𝘁 𝗳𝗼𝗿 𝗠𝗮𝗰𝗵𝗶𝗻𝗲 𝗟𝗲𝗮𝗿𝗻𝗶𝗻𝗴 𝗣𝗿𝗼𝗷𝗲𝗰𝘁𝘀 compared to 𝗥𝗲𝗴𝘂𝗹𝗮𝗿 𝘀𝗼𝗳𝘁𝘄𝗮𝗿𝗲?
- 생성형 AI는 제2의 PC, 사용법 모르면 도태된다
- ‘잘 쌓은 데이터가 돈 된다’… 데이터 전략 과제 6선
- How do you build a 𝗟𝗟𝗠 𝗯𝗮𝘀𝗲𝗱 𝗖𝗵𝗮𝘁𝗯𝗼𝘁 𝘁𝗼 𝗾𝘂𝗲𝗿𝘆 𝘆𝗼𝘂𝗿 𝗣𝗿𝗶𝘃𝗮𝘁𝗲 𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗕𝗮𝘀𝗲?
- Unleashing developer productivity with generative AI
- Hope, fear, and AI
- LG CNS, 챗GPT 기반 코드 생성형 AI ‘AI 코딩’ 개발
- NVIDIA H100 GPUs Set Standard for Generative AI in Debut MLPerf Benchmark
- DeepRob Winter 2023
- KorQuAD 2.0은 KorQuAD 1.0에서 질문답변 20,000+ 쌍을 포함하여 총 100,000+ 쌍으로 구성된 한국어 Machine Reading Comprehension 데이터셋 입니다.
- 3 reasons why your XGBoost model does not work
- 네이버, 하이퍼클로바X 8월24일 공개
- 벡터 데이터베이스 소개 | 음악 검색 기능은 어떻게 만드는 걸까?
- In this article you will learn how to deploy models painlessly, using the right tooling and processes
- Distances, dissimilarities, divergences, diversities, discrepancies, discriminations, displacements, deviations, etc.
- Cohere Announces $270M Series C to Bring Generative AI to Enterprises
- AI Is a Lot of Work
- AI, 생각에 관한 생각
- AWS, 1억 달러 투자해 기업 AI 개발 지원··· 생성형 AI 교육 프로그램 공개
- FastSAM - Fast Segment Anything
- Cohere CEO and president discuss Nvidia and Oracle funding, Hinton comments and the future of LLMs
- Training LLMs with AMD MI250 GPUs and MosaicML
- 카카오스타일의 Amazon SageMaker 분산 훈련을 활용한 카테고리 자동 분류 시스템 모델 구축 사례
- WizMap is an interactive visualization tool for exploring embeddings.
- Welcome to H2O LLM Studio, a framework and no-code GUI designed for fine-tuning state-of-the-art large language models (LLMs).
- "복합 AI 시장 2028년까지 36.5% 성장··· AI 앱 복잡성이 시장 견인"
- vLLM: PagedAttention을 이용한 쉽고, 빠르고 저렴한 LLM 서빙 (vllm.ai)
- OpenLLM - LLM을 프로덕션에서 운영하기 위한 오픈 플랫폼 (github.com/bentoml)
- MongoDB Atlas Vector Search
- Word-level timestamps with Whisper This demo shows Whisper word-level timestamps in action using Hugging Face Transformers. It creates a video showing subtitled audio with the current word highlighted.
- Pydantic is all you need: An OpenAI Function Call Pydantic Integration Module
- 💪 reliableGPT: Stop OpenAI Errors in Production 🚀 - ⚡️ Never worry about overloaded OpenAI servers, rotated keys, or context window limitations again!⚡️
- Google has released an AI for generating music.
- Chatbot Arena Leaderboard Week 8: Introducing MT-Bench and Vicuna-33B
- Machine Learning Mindmap / Cheatsheet
- ✨The Getting Started with AI JS Stack✨
- aeon is an open source toolkit for learning from time series.
- 구글, 직원에 바드 등 GPT 사용 경고…"기밀 유출 우려"
- 2초 분량 샘플로 감쪽같이 흉내?!··· 메타, 텍스트-음성 생성형 AI '보이스박스' 공개
- 차량에 챗GPT 탑재…메르세데스 벤츠, 미국 내 파일럿 프로그램 착수
- XGBoost is one of the most effective algorithms for time-series prediction.
- CS50 Will Integrate Artificial Intelligence Into Course Instruction
- Scaling Kubernetes to 7,500 nodes
- AI at the Intersection: The a16z Investment Thesis on AI in Bio + Health
- Textbooks Are All You Need
- RepoFusion: Training Code Models to Understand Your Repository
- ChatBard : An Intelligent Customer Service Center App
- Scaling Speech Technology to 1,000+ Languages
- When you do QA over a complex data collection, the answer could be spread across multiple sources. Our brand-new multi-router allows you to choose multiple candidate sources to query!
- Emerging Architectures for LLM Applications
- The Man Who Tried to Redeem the World with Logic
- 메타 출신이 만든 데이터 라벨링 업체 리퓨어, 520만 달러 투자 유치
- Bayes Theorem
- vLLM: Easy, Fast, and Cheap LLM Serving with PagedAttention
- ByteDance, 올해만 $1B(1.3조원) 어치의 Nvidia GPU를 먹어치우다 (tomshardware.com)
- Meta, 상업적으로 이용 가능한 무료 AI 모델을 공개할 예정 (artisana.ai)
- Language to Rewards for Robotic Skill Synthesis
- simpleaichat is a Python package for easily interfacing with chat apps like ChatGPT and GPT-4 with robust features and minimal code complexity.
- GPT-4의 Native JSON Output 살펴보기 (yonom.substack.com)
- 맥킨지(McKinsey), 생성형 AI의 경제적 잠재력에 대한 보고서 발간 (66p/PDF/영어) (mckinsey.com)
- OpenLLaMA: An Open Reproduction of LLaMA
- AI 어플리케이션을 위한 새로운 Language Model Stack (sequoiacap.com)
- Grounding LLMs
- ClinicalGPT: Large Language Models Finetuned with Diverse Medical Data and Comprehensive Evaluation
- The New Language Model Stack - How companies are bringing AI applications to life
- With OpenLLM, you can run inference with any open-source large-language models, deploy to the cloud or on-premises, and build powerful AI apps.
- GPT Engineer - Specify what you want it to build, the AI asks for clarification, and then builds it.
- symbex: search Python code for functions and classes, then pipe them into a LLM
- Data Science with Python Roadmap from Scratch- Step by Step Guide for 2023
- Graph in LINER : 글로벌 추천 프로덕트에 GNN 적용하기
- Lanarky - LLM을 프로덕션에 배포하기 위한 오픈소스 프레임워크 (github.com/ajndkr)
- Generative AI Strategy
- GPT-4 Outperforms Humans in Pitch Deck Effectiveness Among Investors and Business Owners
- The Secret Sauce behind 100K context window in LLMs: all tricks in one place
- OpenAI For Java
- 뉴욕타임스가 쓰는 노코드 데이터 시각화 툴 'Datawrapper'
- Predicting Stronghold locations with Bayseian statistics
- 하드웨어
- Designing for visionOS
- 애플, 비전 프로용 개발자 도구 '비전OS SDK' 출시
- “픽업 트럭을 초대형 도트 프린트로” 이색 라즈베리 파이 프로젝트 화제
- 빠른 기계, 느린 기계 (jmmv.dev)
- UNO R4: The new dimension of making
- A 32-BIT RISC-V CPU CORE IN 600 LINES OF C
- 캐스트럴맷 6000 리뷰 | 비싼 가격이 납득되는 가정용 기상 관측기
- 스마트폰·태블릿·PC 대체할까, ‘HMD’의 장단점
- Tape Heads - The Mellotron, an electronic keyboard of recorded samples, heralded the digital age, and its use in “Strawberry Fields Forever” changed pop music history.
- Framework Laptop 16 Deep Dive - Enclosure
- NIST Lays Groundwork for Future Ultra-Precise Timing Links to Geosynchronous Satellites
- 40년도 더 된 컴퓨터로 옷을 디자인하는 일본의 공장.
- Developer tools to create spatial experiences for Apple Vision Pro now available
- Having non-x86 machines makes your life harder, especially in a mixed setup
- Milk-V Duo, $9 RISC-V 컴퓨터 (milkv.io)
- The legend of "x86 CPUs decode instructions into RISC form internally"
- 읽을거리
- 메타버스가 아니다. 공간컴퓨팅이다!
- 새마을금고, 6% 넘는 연체율에 “부실지점 구조조정도 검토”
- 2008-2023 전국 초등학교별 학생 수 증감
- 119REO PRODUCT - 레오백은 폐방화복을 업사이클링, 핸드메이드로 제작한 가방입니다. 가볍고 견고한 방수・방염 소재가 일상을 지켜줍니다.
- “일 그만둬도 연 3억원은 벌어야 부자”…부자들도 진짜 ‘부자’ 꿈꾼다[더 리치 서울]
- Submarine ARA San Juan Simulation (Implosion + Sinking) | Similar: KRI Nanggala 402, Titan
- 월급 216만원, 딱 먹고살면 끝…포기된 평균의 삶
- ‘월급으론 못 살아’… 코인·도박·사치, 빚의 끝에서 본 한국 [이슈&탐사]
- “순간의 소비와 쾌락이 당신의 노화 앞당긴다”
- "이메일은 여전히 효과적인 마케팅 채널"
- "전세금 못 돌려줘요" 난리난 집주인들..빚 내도 반환 어려워
- The Best Way To Cook Steak? | Techniquely with Lan Lam
- Scores decline again for 13-year-old students in reading and mathematics
- The Real Lesson of The Truman Show
- 도레이씨의 개발 비화
- The LCD Monster Has Stopped Evolving
- On the Risks of Stealing the Decoding Algorithms of Language Models
(보너스: How do you build a 𝗟𝗟𝗠 𝗯𝗮𝘀𝗲𝗱 𝗖𝗵𝗮𝘁𝗯𝗼𝘁 𝘁𝗼 𝗾𝘂𝗲𝗿𝘆 𝘆𝗼𝘂𝗿 𝗣𝗿𝗶𝘃𝗮𝘁𝗲 𝗞𝗻𝗼𝘄𝗹𝗲𝗱𝗴𝗲 𝗕𝗮𝘀𝗲? via @Aurimas_Gr)
EOB