본문 바로가기

전체 글48

[생각] 생산성 딜레마 생산성을 높여준다는 AI 툴이 때론 우리의 생산성을 파괴하고 있다어제는 Claude Code, 오늘은 oh-my-opencode, 내일은 OpenClaw, ... 수많은 혁신적인 툴이 쏟아진다.도구 뿐만 아니다. Ralph Loop, Human-in-the-loop(HITL), Harness 등 이를 사용하는 수많은 방법론도 함께 쏟아진다. "이것만 쓰면 개발 속도가 10배 빨라진다"는 소식에 뒤처질까 불안해하며(FOMO) 끊임없이 새로운 도구를 설치한다.단축키를 익히고, 플러그인을 연동하고, 프롬프트를 다듬는다. 하지만 정작 가장 중요한 핵심 비즈니스 로직은 단 한 줄도 작성하지 못한 채 하루가 끝난다. 미래의 생산성을 위한다는 명분으로 현재의 몰입을 희생하는 주객전도의 형태이다.끝나지 않는 야크 털 .. 2026. 3. 5.
[리뷰] 실력 없음. 감각 없음. (No Skill. No Taste.) https://blog.kinglycrow.com/no-skill-no-taste/ No Skill. No Taste.I was reading a thread on HN and I started writing this super long comment and rewriting and editing and thought, hey, if I'm doing this I clearly care enough about the state of Show HN and HN in general to write a post on it. I've written code sinceblog.kinglycrow.comhttps://news.hada.io/topic?id=26881 실력 없음. 취향 없음. | GeekNewsLLM.. 2026. 2. 23.
[리뷰] DeepSeek이 바꿔버린 모든 것: MoE와 RLVR, 2025년 AI 회고 https://youtu.be/iDd-7trU3VE위 팟캐스트 영상를 보고 생각을 정리한 리뷰 입니다. 해당 영상의 댓글로 PDF 자료와 전사본(transcript)을 제공하니 참고해서 보시는 것을 추천합니다.1. MoEMoE란MoE는 전체 파라미터는 매우 크지만, 실제 토큰 생성 시에는 일부 전문가(Expert) 모델만 활성화하여 연산 효율을 극대화하는 아키텍처Scailing Raw 처럼 Sparcity가 커질수록, Compute Multiplier가 더 커짐같은 FLOPs를 유지한 채 총 파라미터를 더 키울 수 있음. 이제 MoE가 아닌 모델을 보기 힘들어짐10의 24승 FLOPs(연산량) 수준에서 MoE 모델은 일반적인 Dense 모델보다 7배 이상의 효율을 냄MoE가 왜 좋을까"수학은 이 expe.. 2026. 2. 19.
[회고] 2025년 1-2월부스트캠프네이버 부스트캠프 AI Tech 7기 NLP Track 교육을 마무리했다.교육은 1년이 지난 지금 시점에도 잘 들었다고 생각한다.양질의 강의와 커리튤럼, 같이 고민해주고 공유해주는 좋은 멘토님과 팀원들을 만날 수 있었다.학교로 돌아가야해서 기업 연계는 받지 못했다.3-4월스타트업 입사좋은 기회가 생겨 스타트업에 계약직으로 합류했다. 학교 다니면서 내 스케줄에 맞춰 출근할 수 있다는 점이 매력적이었다.포지션은 ML 백엔드 개발자였고, 주로 의료 데이터를 다루었다.머신러닝 예측 모델을 개발하고, 시각화 툴을 서버/클라이언트 구조로 전환 후 클라우드 마이그레이션하는 작업이었다.딥러닝논문읽기 스터디 참여평소 관심있게 보던 스터디그룹에 참여했다. 대학원에서 논문세미나 하는 것과 유사한 형태로 진행.. 2026. 1. 29.
MiniRAG: Extremely Simple Retrieval-Augmented Generation 논문 리뷰 ABSTRACT & INTRODUCTION문제 의식 (Problem Statement)기존 RAG 프레임워크는 주로 LLM(Large Language Models)에 의존하고 있어, 자원이 제한된 환경(엣지 디바이스 등)에서 SLM(Small Language Models)을 사용할 때 심각한 성능 저하가 발생한다.SLM은 복잡한 의미 이해(Semantic Understanding)와 텍스트 처리 능력이 부족하여 기존의 정교한 RAG 파이프라인(LightRAG, GraphRAG 등)을 소화하지 못한다.MiniRAG의 목표SLM의 제약 사항(제한된 추론 능력)을 고려하여 극도로 단순하고 효율적인 RAG 시스템을 설계한다.SLM이 복잡한 의미 이해는 못 해도 패턴 매칭은 잘한다는 점에 착안한다.핵심 솔루션복잡.. 2026. 1. 6.
Parallel Scaling Law for Language Models 논문 리뷰 링크https://arxiv.org/abs/2505.10475 Parallel Scaling Law for Language ModelsIt is commonly believed that scaling language models should commit a significant space or time cost, by increasing the parameters (parameter scaling) or output tokens (inference-time scaling). We introduce the third and more inference-efficient scaling pararxiv.orghttps://github.com/QwenLM/ParScale GitHub - QwenLM/ParScal.. 2025. 10. 6.
728x90