분류 전체보기

· 데이터
Binary Prediction with a Rainfall DatasetPlayground Series - Season 5, Episode 3www.kaggle.com ◾결과3.24 ~ 3.31까지 짧게 kaggle playground 대회에 참가했다.머신러닝 파이프라인을 확고히하고 싶어서 EDA - Data Preprocessing - Modeling 코드를 다지는 걸 위주로 진행했다. 짧은 시간 안에 다양한 모델 조합을 실험했고, 결과는 상위 17%로 마무리했다.Private score가 더 좋은 제출물도 있어서 조금 아쉽긴 하지만 제출물을 잘 고르는 것도 실력이니... ㅜ.ㅜ초기 제출물들이 hyperparameter optimizing 단계에서 코딩을 잘못해서 data leakage 문제가 있었다..
· 잡담
Upstage에 재직 중인 김남혁 강사님의 스토리 및 부트캠프 성공 가이드 특강 후기입니다.◾강사님 소개전공 : 수학복수전공 : 경제금융학데이터 분석가 → 인공지능 이렇게 관심사가 바뀌어 개발, 인공지능 공부를 시작하셨다고 한다.경험boostcamp 1기Google Developers Machine Learning Bootcamp (2021)첫 직장 Upstage!Data Manager 직무학습 데이터 구축 (수집, 라벨링, ...)평가 데이터 구축데이터 구축에 필요한 라이브러리 개발데이터 구축에 필요한 툴 개발...데이터 매니저 직무에 대해서 처음 알게 되었는데 강사님 말씀처럼 ML/DL, 개발, 도메인에 대한 지식이 포괄적을 필요한 직무인 것 같다. ◾부트캠프 성공 가이드면접을 위해 기본기를 탄탄히 ..
· 잡담
◾이전 경험KOSMO(한국소프트웨어인재개발원) : 개발 입문. Java 위주로 웹 프로그래밍 학습.BITAMin 12기 : 머신러닝, 딥러닝 첫 공부 시작. 3번의 딥러닝 프로젝트 진행Withmind 인턴 : RAG 입문. 첫 실무 경험.◾앞으로의 학습 계획🔻Deep Learning약 1년 반 동안 ML & DL 공부를 하고 있지만, 기초가 부족하다고 생각한다. 특히 아직도 수학에 많은 부족함을 느끼고 있다. 정규 강의에는 수학이 없지만 패스트캠퍼스(=커널아카데미)와 함께 하는 부트캠프인 만큼 패캠의 여러 강의들도 제공해주고 있다. DL의 바이블같은 모델들을 직접 구현할 수 있을 정도로 공부해보고 싶다. CNN, Vanilla Transformer정보는 직접 구현이 가능할 정도로 PyTorch와 익숙해..
· 잡담
[Youtube - 논문 관리 툴 추천: Zotero + Notion = Notero! | 이성수][Youtube - sync zotero → notion // research paper workflow (2023 tutorial)['Notero 논문 정리 방법' 참고하기 좋은 youtube 영상]  ◾논문 리뷰 방법 변경 과정논문 리뷰를 티스토리 블로그에 계속 쓰자니 논문 간 연관성(서로 참조하는 관계같은 것)을 정리하기 어렵고 논문 제목이 모델 이름이랑 일치하는 것도 아니라서 tag 같은 걸로 내가 나중에 찾기 쉽게 할 필요도 있었다.  그래서 새롭게 논문 정리를 하려고 노션 데이터베이스를 만들어서 참조 관계를 구현해보려 했는데... 이렇게 Join 속성에 서로 다른 논문 페이지를 링크로 참조해 보았..
🫡Survey 논문인 만큼 깊은 지식보단 LLM-MA 시스템에 대한 전반적인 설명으로 이루어져 있습니다. 관심 있는 부분은 더 깊게 공부할 수 있도록 Survey 논문에 등장한 참고문헌을 최대한 포스팅에 포함했습니다.0. Abstract LLM의 눈에 띄는 성과, LLM에 기반한 single-Agent 시스템의 발전과 함께 2023년부터 LLM 기반의 Multi-Agents 시스템이 등장하기 시작하여 본 서베이 논문을 통해 LLM-MA 시스템의 발전과 도전과제 등을 정리하고자 한다. 본 서베이 논문에서는 아래와 같은 내용을 다룬다. 어떤 도메인, 환경에서 주로 LLM-MA를 사용하는가? 에이전트들은 어떻게 프로파일링되고 서로 소통하는가? 어떤 메커니즘이..
🫡중간중간 초록색 하이라이트된 용어들은 아래 용어 설명을 참조하시면 됩니다. [ 용어 설명 ] permutation-invariant : attention 메커니즘은 auto-regressive와 달리 하나의 sequence를 한 번에 입력한 후 행렬 연산을 통해 서로의 가중치를 계산한다. 따라서 입력 시퀀스의 각 요소 순서가 바뀌더라도 출력되는 attention matrix는 동일하다. 따라서 근본적으로 어텐션 메커니즘은 입력의 순서와 상관없이 출력이 동일하다는 특징이 있고, 이는 단점이 될 수도 있지만 이런 특징 덕분에 병렬처리가 가능하여 효율적인 연산도 가능하다는 장점도 있다. positional embeddings(encoding) : sequence 데이터..
0. Abstract RAG의 발전과 함꼐 RAG를 평가하는 프레임워크인 RAGAs도 큰 인기를 끌고 있다. 그러나 RAGAs는 평가 지표의 수치에 대한 구체적인 해석이 부족하다는 문제가 있다. 그래서 본 논문에서는 RAGAs에서 조금 변형된 버전의 지표들과 함께 RAGAs와 같은 평가 프레임워크를 여러 도메인에서 적용할 수 있는지 확인하기 위해 텔레콤 도메인에서 실험하고자 한다.1. Introduction Introduction에서는 RAG, NLG evaluation, RAGAs에 대해 소개하고 있다. 궁금하신 분들은 G-EVAL, RAG, RAGAs에 대한 이전 포스팅들을 살펴보면 좋을 것 같다. 본 논문에서 telecom domain을 특정한 이유는, 특정 분야의 용어..
🫡 -->0. Abstract RAGAs(RAG Assessment), 이 프레임워크는 사람이 만드는 ground truth 데이터 없이도 RAG를 평가할 수 있게 해주는 'reference-free' evaluation framework이다. RAG는 knowledge-intensive task에서 LLM이 사용가능한 지식을 제공해주고, hallucination 문제를 해소할 수 있다는 장점이 있으나 RAG 파이프라인을 평가하기 위해서는 여러 사항을 고려해야 한다. 검색 시스템이 얼마나 관련 있는 passage를 식별하는지, LLM이 얼마나 passage 내에서 답변을 생성하는지(=faithfulness), 또는 LLM이 생성한 문장의 퀄리티 그 자체도 평가의 대상이기도 하다. 이 모..
🫡아래 자료를 참고하였습니다.TeddyNote Youtube오몰내알 Tistory blog🔻Recall, Precision, F1-score 복습 ML/DL을 공부한 사람들은 이미 이 평가지표들에 대해 익술할 것이다. RAG도 큰 틀에서 보면 검색한 문서가 정답인지 아닌지 분류하는 classification task라고 볼 수 있으므로 해당 task의 평가지표를 활용할 수 있다. 아래의 간단한 예제를 통해 recall, precision, f1-score 계산 방법을 복습해보자. (노란 gt는 negative, 파란 gt는 positive)N,P : 예측이 true인지, false인지에 대한 정보T,F : 예측이 맞았는지 틀렸는지에 대한 정보gt (ground truth) : 정답..
🫡 Ref : PyTorch Docs🔻Introduction torch.compile은 JIT(Just-in-time compile)를 통해 PyTorch 코드를 더 빠르게 실행 가능하도록 만들어준다고 한다. 그럼 JIT란? 인터프리터 방식과 정적 컴파일(전통적인 컴파일) 방식을 혼합한 형태라고 한다. 기존의 python은 인터프리터 언어로, 코드를 위에서부터 아래로 읽어가며 실행했다. 기존의 정적 컴파일 방식은 코드 실행 전에 미리 자연어 코드를 기계어로 변환하는 것이다. JIT는 둘을 혼합하여 코드 실행 직전에 자연어 코드를 컴파일하여 캐싱하여 같은 함수가 반복되어 호출될 때 매번 기계어 코드를 생성하는 것을 방지한다고 한다.(ref : 위키백과) document에서..
song9
'분류 전체보기' 카테고리의 글 목록