분류 전체보기60 [TWIL] 12월 4주차 This Week네이버 부스트캠프 AI Tech 19주차강의 & 세션이번 주차는 최적화/경량화에 관한 내용이다. NLP 트랙에서는 앞서 배웠던 개념과 겹치는 내용이나 유사한 내용이 많아 쉽게 들을 수 있었다. 강의 키워드는 다음과 같다. Pruning: 신경망 모델에서, 노드(뉴런)나 연결(시냅스)을 제거하여 모델의 크기와 계산 비용을 줄이는 기법Knowledge Distillation: 고성능의 Teacher 모델로부터 지식을 전달 받아서 Student 모델을 학습 시키는 기법Quantization: 숫자의 정밀도(precision)을 낮추는 최적화 및 경량화 기법으로 계산 속도 향상, 메모리 사용량 감소에 기여PEFT: 모델 전체 parameter를 학습하는 FT와는 다르게 필요한 일부분을 학습하는.. 2024. 12. 27. AI Research Engineer 모의 면접 후기 네이버 부스트캠프 AI Tech에서 "NAVER Cloud 초거대 AI 에이전트 연구 기술 지원을 위한 AI Research Engineer" 라는 채용 공고에 대한 모의면접을 진행했다. 변성윤 마스터님께서 진행하시는 '두런두런'이라는 프로그램 내에서 지원자가 원하는 공고와 자신의 이력서를 제출하여 진행했던 내용이며 약 20분간 진행되었다. 아쉬운 점전반적으로 아쉬웠던 점은 꼬리 질문 위주의 압박 면접에 대해 전혀 준비되지 않았고, 평소보다 과하게 긴장했던 점이다. 이 때문에 면접 과정에서 말리기 시작했다. 또한 답변을 너무 건조하게 준비했던 것 같다. 이력서를 작성하고 피드백하는 과정에서 구구절절함을 덜어내고 최대한 건조하게 작성하려고 노력했는데, 그런 태도가 면접 준비까지 이어진 것 같다. 그러나 면.. 2024. 12. 18. [TWIL] 12월 2주차 This Week네이버 부스트캠프 AI Tech 17주차강의 & 세션이번 주차는 변성윤(@data.scientist 인스타그램과 @카일스쿨 유튜브 등으로 알려진 분이다.) 마스터님이 준비한 Product Serving을 위한 강의들이다. Airflow, poetry, fastAPI, Docker 등에 대해 배웠다.실습 & 과제실습에서는 Airflow 사용하여 Batch Job을 구현하고 슬랙 알림과 연동하는 방법과 fastAPI를 이용해 model을 서빙하는 내용을 학습했다. 관련 자료는 https://github.com/zzsza/Boostcamp-AI-Tech-Product-Serving 에서 확인할 수 있다.과제는 Airflow를 이용하여 Batch Serving을 구현하는 내용이다.데이터를 로드하.. 2024. 12. 13. [네이버 부스트캠프 AI Tech 7기] Level3 수능 문제 풀이 모델 생성 프로젝트 최종 리포트 https://github.com/boostcampaitech7/level2-nlp-generationfornlp-nlp-02-lv3 GitHub - boostcampaitech7/level2-nlp-generationfornlp-nlp-02-lv3: level2-nlp-generationfornlp-nlp-02-lv3 created by GitHub Classlevel2-nlp-generationfornlp-nlp-02-lv3 created by GitHub Classroom - boostcampaitech7/level2-nlp-generationfornlp-nlp-02-lv3github.com목차0. 프로젝트 개요1. 모델 2.데이터3. 추론4. 앙상블5. 최종 제출 데이터6. 개인회고0. 프로젝트 .. 2024. 12. 3. Cache와 Retry로 시간·비용 효율적 API 호출하기 문제상황허깅페이스에 SQuAD 데이터를 불러와서 한국어로 번역하여 학습 데이터로 사용하기 위해, 구글번역기 api를 이용하여 이를 구현하려고 한다.데이터를 살펴보니 context 컬럼에는 중복된 데이터가 많이 보인다. 중복된 데이터를 번역하기 위해 매번 API를 호출하면 비효율적이다.실행 시간뿐만 아니라 유료 api를 사용한다면 비용적으로도 많이 부담이 될 것이다.코드 설명의존성 설치번역에 필요한 googletrans와 진행 상황을 출력하기위한 tqdm패키지를 설치한다.!pip install googletrans tqdm캐시 구현이미 한번 api를 호출한 데이터를 반복하지 않도록, 캐시 파일을 json으로 생성하고 관리하는 TranslationCache클래스를 구현한다.enter와 exit함수를 통해 인.. 2024. 11. 24. [네이버 부스트캠프 AI Tech 7기] Level2 Data Centric - 주제 분류 프로젝트 최종 리포트 https://github.com/boostcampaitech7/level2-nlp-datacentric-nlp-04 GitHub - boostcampaitech7/level2-nlp-datacentric-nlp-04: level2-nlp-datacentric-nlp-04 created by GitHub Classroomlevel2-nlp-datacentric-nlp-04 created by GitHub Classroom - boostcampaitech7/level2-nlp-datacentric-nlp-04github.com 1. 프로젝트 개요자연어에서 독해 및 분석 과정을 거쳐 주어진 태스크를 수행하기 위해서는 자연어의 주제에 대한 이해가 필수적이다. KLUE-Topic Classification b.. 2024. 11. 10. 이전 1 2 3 4 ··· 10 다음