Jost Do It.

그냥 IT해.

반응형

Study/딥러닝 11

[GPT] token 수 계산하기

개요GPT 모델은 input과 output의 토큰 수에 따라 비용을 다르게 책정하고 있다.여기서 한글은 보통 글자 하나가 토큰 1개로 계산되는 반면, 영어 같은 경우는 단어들이 토큰 1개로 계산되는 경우가 많다. 문제 상황문서를 요약하기 위해 GPT를 사용 중인데, 일부 문서는 GPT 모델에서 허용하는 최대 토큰 수를 넘는 경우가 있었다.따라서 문서의 내용을 잘라내서 GPT에 입력해야 했는데, 내용을 최대한 반영하기 위해 token 수를 계산할 필요가 있었다. 방법구글링해보니 GPT에 사용된 tokenizer 인코딩 방식이 오픈돼 있었고, tiktoken 라이브러리를 통해 토큰 수를 계산할 수 있다.최신 버전 GPT-4o의 경우 "o200k_base" 인코딩 방식이 적용돼 있다고 한다 (그 외 모델의 인..

Study/딥러닝 2024.07.02

[대화형 AI] TaskWeaver에 대해 알아보자.

개요 MS 대화형 AI는 서비스 제품인 1. MS Copilot과 오픈소스로 공개된 2. TaskWeaver, 3. AutoGen 으로 나뉩니다. 그 중 TaskWeaver에 대해 알아봅시다. 2. TaskWeaver 오픈소스 소개 Task Weaver는 데이터 분석 작업을 목적으로 개발된 AI입니다. 사용자의 프롬포트에서 요청을 해석하고, 실행 가능한 코드 스니펫을 생성해 사용자에게 결과와 함께 제공합니다. 데이터 분석 결과와 함께 관련 코드까지 제공한다는 장점이 있습니다. UI 인터페이스도 제공할 수 있습니다. 오픈소스 특징 Task Weaver는 2개의 대화형 AI에 각각 역할을 설정해 AI간 대화(interaction)를 통해 프롬포트 결과를 출력합니다. Planner: 사용자가 입력한 프롬포트를..

Study/딥러닝 2024.03.16

[대화형 AI] Microsoft Copilot에 대해 알아보자.

개요MS 대화형 AI는 서비스 제품인 1. MS Copilot과 오픈소스로 공개된 2. TaskWeaver, 3. AutoGen 으로 나뉩니다. 그 중 MS Copilot에 대해 알아봅시다. 1. MS Copilot서비스 소개Copilot은 MS사의 여러 제품에 최적화된 대화형 AI 챗봇을 범용적으로 부르는 이름입니다.크게 윈도우 11 Copilot, 앱 전용 Copilot, Bing Copilot 3가지로 나뉩니다.현재 윈도우 11은 프리뷰로 일부 유저만, Bing Copilot은 웹에서 사용이 가능합니다. 앱전용은 앱마다 사용 권한이 다르게 설정돼 있습니다.서비스 특징Copilot 지원 대상 앱Word, PowerPoint, Excel, Teams, Github, Outlook, OneNote, …한..

Study/딥러닝 2024.03.11

[ChatGPT] Error code 400 Failed to index file: Unsupported file 문제

문제 상황 GPT 어시스턴트에 파일을 넣어서 "retrival" 기능을 이용하는 코드를 다음과 같이 짰다. 참고로 파일 형식은 .txt이다. file = client.files.create( file=open(file_path, "rb"), purpose='assistants' ) assistant = client.beta.assistants.create( instructions=roleA, model="gpt-4-turbo-preview", tools=[{"type": "retrieval"}], ) thread = client.beta.threads.create( messages=[ { "role": "user", "content": prompt_text, "file_ids": [file.id] } ]..

Study/딥러닝 2024.03.05

[온라인 강의] 스탠포드 대학 딥러닝 강의 목록

최근 딥러닝을 다시 공부해야 될 필요성을 많이 느낀다. 우선 책으로만 공부하다 보니 머리 속에 정리가 잘 안됐다. 그리고 최신 트렌드나 실제 적용을 해보질 못하니 탁상공론을 하는 느낌이 계속 들었다. 그래서 딥러닝 강의들을 찾던 중 스탠포드 대학에서 온라인에 무료로 공개한 딥러닝 강의가 많이 있다는 것을 알게 되었다. 아래는 주제별 강의 목록이다. 스탠포드 대학 딥러닝 강의 목록 Deep Learning http://web.stanford.edu/class/cs230/ [ Natural Language Processing ] CS 124: From Languages to Information (LINGUIST 180, LINGUIST 280) http://web.stanford.edu/class/cs12..

Study/딥러닝 2022.11.04

[CS230] Deep Learning Lecture 6 Deep Learning Project Strategy

CS230 Deep Learning Lecture 6. Deep Learning Project Strategy 강의영상 이번 강의는 Ng 선생님께서 실제 딥러닝 프로젝트를 진행할 때 생각해볼 전략들에 대해 설명해주셨다. 강의노트는 따로 제공되지 않았다. 수업에서 왜 실제 프로젝트에서 사용할 전략들을 배워야 하는가? 경험을 얻는 방법은 크게 두가지가 있다. 1. 실제 좋은 AI 팀에 들어가서 여러 문제들을 만나면서 경험하는 것 (매우 긴 시간이 걸림) 2. 수업에서 소개된 사례들을 생각하고 고민하면서 해법들을 배우는 것 (매우 짧은 시간) 1번의 고민을 한 사람들의 생각과 해결법들을 빠르게 배울 수 있기 때문에 수업에서 전략들을 배우는 것이 큰 도움이 된다. 효율적인 스타트업 팀이 프로젝트를 진행할 때 어..

Study/딥러닝 2022.09.21

[CS230] Deep Learing Lecture 5 AI + Healthcare

CS230 Deep Learning Lecture 5. AI + Healthcare Guest Slides 강의노트 강의영상 이번 강의는 처음에 객원(Pranav 박사)께서 AI를 헬스케어에 적용하는 것에 대한 전반적 Overview를 설명하시고, 뒤에는 Kian형님이 관련된 Case Study 사례를 소개하셨다. DL for Healthcare (Phd. Pranav Rajpurkar) 객원강사께서는 크게 아래 3가지를 강의에서 다루려고 하였다. 1. 헬스케어에서의 AI 적용 방법 2. 3가지 Case Study와 Research 3. Healthcare에 직접 적용해볼 수 있는 AI에 대한 생각 먼저 헬스케어에서 중요한 것을 생각해보자. 헬스케어 분야를 다룰 때 다음과 같은 질문들을 생각해봐야 한다...

Study/딥러닝 2022.09.20

[CS230] Deep Learning Lecture 4 Adversarial Attacks / GANs

CS230 Deep Learning Lecture 4. Adversarial Attacks / GANs 강의노트 강의영상 이번 강의에서 딥러닝 모델을 속이는 방법인 Adversarial Attacks이 무엇인지, 어떻게 속일 수 있는지를 알아보았다. (개인적으로 딥러닝 네트워크를 적대적으로 공격한다는 표현이 재미있는거 같다.) 이를 바탕으로 생성모델 GAN에 대한 개념과 GAN과 관련된 여러 연구의 아이디어를 살펴보았다. 예시를 통해 알아보는 네트워크 적대적 공격 방법 Adversarial attacks: 뉴럴넷에 전달하는 Input 값(벡터, 이미지 등)을 조작하여 특정 정보와 전혀 상관 없는 내용의 Input을 특정 정보로 네트워크가 예측하게 만드는 방법. 즉, 네트워크를 속이는 방법이다. Adver..

Study/딥러닝 2022.09.20

[CS230] Deep Learning Lecture 3 Full-Cycle Deep Learing Projects

CS230 Deep Learning Lecture 3. Full-Cycle Deep Learing Projects 강의영상 이번 강의는 회사 단위에서 큰 딥러닝 프로젝트에서 ML 모델을 어떻게 학습하는지에 대해 다루었다. Ng 아저씨가 강의를 진행했고, 슬라이드 없이 판서로 진행하셨다. (Ng 아저씨는 강의노트보다는 판서가 편하신듯) 좋은 딥러닝(DL) 전문가가 되려면? Interest Data Domain Knowledge: 특정 분야의 도메인 지식은 해당 분야에 unique한 기여를 불러올 수 있다. 도메인 지식과 딥러닝 지식은 양자 택일의 문제가 아니라 같이 가져가야 할 문제이다. Utility Feasibility: 딥러닝으로 현실적으로 실현 가능한 것과 실현 불가능한 것을 구분할 수 있어야한다...

Study/딥러닝 2022.09.19

[CS230] Deep Learning Lecture 2 Deep Learing Intuition

CS230 Deep Learning Lecture 2. Deep Learing Intuition 강의노트 강의영상 이번 강의는 제목처럼 딥러닝에 대한 직관을 끌어내려 하였다. 수식도 일부 있었지만, 주요점은 어떤 문제를 풀 때 어떻게 딥러닝을 적용하는 것이 좋은가? 에 초점을 두었다 생각한다. 주요 슬라이드별로 내용을 정리하려 한다. Lecture 2 소개 이번 강의는 AI project를 진행할 때 의사결정을 어떻게 할 것인지를 주로 다루었다. 특히 아래의 4가지 How To에 대해 설명하였다. Collect: 데이터를 어떻게 모을 것인가? Label: 데이터의 라벨링을 어떻게 할 것인가? Architecture: 모델링 구조를 어떻게 설계할 것인가? Optimize: 해당 모델을 어떻게 최적화할 것인..

Study/딥러닝 2022.09.19
반응형