본문 바로가기

분류 전체보기61

[네이버 부스트캠프 AI Tech 7기] Level2 Data Centric - 주제 분류 프로젝트 최종 리포트 https://github.com/boostcampaitech7/level2-nlp-datacentric-nlp-04 GitHub - boostcampaitech7/level2-nlp-datacentric-nlp-04: level2-nlp-datacentric-nlp-04 created by GitHub Classroomlevel2-nlp-datacentric-nlp-04 created by GitHub Classroom - boostcampaitech7/level2-nlp-datacentric-nlp-04github.com 1. 프로젝트 개요자연어에서 독해 및 분석 과정을 거쳐 주어진 태스크를 수행하기 위해서는 자연어의 주제에 대한 이해가 필수적이다.  KLUE-Topic Classification b.. 2024. 11. 10.
[네이버 부스트캠프 AI Tech 7기] Level2 MRC - ODQA 프로젝트 최종 리포트 https://github.com/boostcampaitech7/level2-mrc-nlp-04 GitHub - boostcampaitech7/level2-mrc-nlp-04: level2-mrc-nlp-04 created by GitHub Classroomlevel2-mrc-nlp-04 created by GitHub Classroom. Contribute to boostcampaitech7/level2-mrc-nlp-04 development by creating an account on GitHub.github.com 0. 프로젝트 개요프로젝트 개요Question Answering(QA)는 다양한 종류의 질문에 대답하는 인공지능을 만드는 연구분야이다. 다양한 QA 시스템 중, Open-Domain .. 2024. 10. 26.
[네이버 부스트캠프 AI Tech 7기] Level2 MRC - ODQA 프로젝트 2주차 회고 네이버 부스트캠프 AI Tech 9주차프로젝트지난 주차에 이어 MRC(Machine Reading Comprehension) ODQA(Open-domain Question Answering) 프로젝트를 진행하고 있다. 강의는 빠르게 지난 주에 마무리하고 이번 주는 계속 프로젝트 작업 중이다.진행했던 작업:베이스라인 간소화Elasticsearch Retriever 구현베이스라인 고도화 및 리펙토링진행했던 실험:모델 비교 실험데이터 클리닝 실험train/val 데이터셋 재분할 실험베이스라인 간소화, 고도화, 리펙토링이번 프로젝트에서 가장 주요하게 팀에 기여하는 부분이라고 생각한다.Elasticsearch Retriever 구현Elasticsearch에 플러그인으로 설치할 수 있는 noritokenizer를 .. 2024. 10. 18.
[네이버 부스트캠프 AI Tech 7기] Level2 MRC - ODQA 프로젝트 1주차 회고 네이버 부스트캠프 AI Tech 8주차강의 & 세션이번 주차는 MRC(Machine Reading Comprehension)이다. ODQA(Open-domain Question Answering) Task를 풀기 위한 여러 이론 강의들로 구성되어 있었다. ODQA는 주어지는 지문이 따로 존재하지 않고 사전에 구축되어있는 Knowledge resource에서 질문에 대답할 수 있는 문서를 찾기 때문에 질문에 관련된 문서를 찾아주는 "retriever" 단계와 관련된 문서를 읽고 적절한 답변을 찾거나 만들어주는 "reader" 단계로 구성된다. 약 3주 동안 진행될 프로젝트의 이론 강의이기 때문에 서둘러 듣고 바로 프로젝트를 시작하게 되었다.프로젝트두번째 프로젝트이자 Level2의 첫 번째 프로젝트가 밝았다.. 2024. 10. 12.
네이버 부스트캠프 AI Tech 7기 Level1 STS Competition 프로젝트 최종 리포트 Level1를 마무리하는 프로젝트로 진행했던 STS(Semantic Text Similarity) 대회가 끝났다.우리 팀에서는 기록보다는 end-to-end로 경험하는 것을 목표로 하며 하고 싶은 파트를 자유롭게 진행했다.NLP 코스의 첫 프로젝트에서 어떤 시행착오를 겪었으며, 무엇을 배웠고, 아쉬웠던 점을 차례로 작성하고자 한다.대회 소개특징설명목표의미 유사도 판별(Semantic Text Similarity, STS): 두 문장이 의미적으로 얼마나 유사한지를 수치화하는 자연어처리 태스크평가지표피어슨 상관 계수(두 변수 X 와 Y 간의 선형 상관 관계를 계량화한 수치)를 사용규칙일일 제출횟수는 '팀 단위 10회'로 제한 외부 데이터셋 사용 금지기간2024.09.11 10:00~2024.09.26 19:.. 2024. 9. 27.
[TWIL] 9월 2주차 스터디 This Week네이버 부스트캠프 AI Tech 6주차강의 & 세션이번 주차는 프로젝트를 위한 강의들이었다. Linux, streamlit 등에 대해 배웠다.또한 NLP Task들에 대해 배웠다. N21, N2N, N2M 같이 출력 갯수로 Task를 분류하는 표현은 처음 들어봐서 검색해봤는데 교수님이 주로 사용하시는 표현 같았다. (전 기수들 포스팅이 잔뜩)자연어 처리 문제 개관 — Application 관점 여기 교수님이 직접 작성하신 포스팅이 있는데 참고하면 좋겠다. 교수님이 글을 잘 쓰셔서 다른 포스팅들 또한 매우 도움된다. 프로젝트대망의 첫 프로젝트 주차가 밝았다. NLP stage는 문장 간 유사도 측정 테스크를 푸는 프로젝트를 진행한다.각 팀에는 4대의 V100 32G GPU 서버가 주어지고.. 2024. 9. 13.