본문 바로가기

전체 글

(13)
NExT-GPT: Any-to-Any Multimodal LLM by NExT++ Lab of <National University of Singapore> 1. Introduction우리의 세계는 본질적으로 multimodel이다. 사람들이 다른 감각 기관을 통해 이미지, 언어, 비디오, 소리 등을 인지하기 때문이다. 따라서 사람을 모방하기 위한 any-to-any 모델을 만들기 위한 노력이 계속되어왔고, 본 연구에서는 이전까지의 한계를 보완하기 위한 모델로 NExT-GPT를 제안한다. 이는 any-to-any MM-LLM으로 텍스트, 이미지, 비디오, 오디오 이 네 개의 방식 중 어느 조합으로도 input과 output을 다룰 수 있다. 아래 사진은 이 모델의 구조로, 세 개의 계층으로 구성된다.첫 번째 계층에서는 다양한 방식의 인풋을 받는 인코드를 배열한다. 이 인코더는 LLM이 이해할 수 있는 언어와 유사한 표현을 출력한다. 두 번째 계층에서는 이미 ..
LARGE LANGUAGE MODELS AS OPTIMIZERS by Google DeepMind 1. IntroductionOptimization(최적화)는 각 task에 따라 커스터마이즈되어야 하는 매우 중요한 단계이다. 본 연구는 Optimization by PROmpting(OPRO)를 제안하며, LLM을 옵티마이저로 활용하여 간단하고 효과적으로 최적화를 진행할 수 있는 방법이라고 소개한다. 최적화 문제를 프로그래밍된 solver를 이용하는 대신, 자연어로 최적화 문제를 묘사한 다음 problem 묘사와 이전에 찾은 solution으로부터 LLM이 새로운 solution을 만들어낼 수 있도록 하는 것이다.  최적화에서의 LLM의 잠재력을 보여주기 위해 본 연구에서는 먼저 선형 회귀와 외판원 문제를 적용해본다.(본 요약에서는 선형 회귀만 설명하겠다) 이후, LLM의 프롬프트 최적화 능력을 보여주..
Self-Rewarding Language Models by Meta AI 1. Introduction기존 LLM은 RLHF(Reinforcement Learning from Human Feedback)을 통해 성능을 향상시켜왔다. 사람의 선호도, 피드백을 통해 강화학습을 해온 것이다. 강화학습 알고리즘 중에도 기존에는 PPO를 사용하여 reward 모델이 필요했었으나, 최근에는 DPO를 이용하여 reward 모델도 필요 없이 human preferences를 직접적으로 이용할 수 있게 되고 있다. 본 연구에서는 인간에 의해 병목 현상이 발생할 수 있는 RLHF 대신, reward model과 LLM을 하나의 모델이 할 수 있도록 하는 방법을 연구했다.본 연구에서 소개하는 Self-Rewarding Language Model은 다음과 같다.step 1: Self-Instruct..
[정융탐] EPL 축구 경기 승부예측 AI 개발 프로젝트 (4) 1. 계획 설정  가. 문제 인식나는 평소 해외축구를 즐겨 본다. 특히 토트넘 핫스퍼 팬이라 EPL(English Premier League) 경기를 자주 챙겨보는 편이다. EPL은 세계 최고의 축구 리그로 세계 최고의 선수들이 모여 있다. 나의 경우 많은 축구 경기 결과를 확인하고 있음에도 불구하고 내가 예측한 대로 축구 경기가 흘러가지 않는 경우가 많고, 특히 내가 응원하는 팀이 패배할 경우 많은 상실감을 느끼기도 한다. 이런 상황에서 내가 EPL 경기 결과를 예측할 수 있다면 좋을 것 같았고, 주어진 데이터를 활용한 딥러닝 알고리즘으로 본 문제를 해결하려고 한다. 나. 관련 조사 시행EPL 승부예측을 위해 여러 관련 데이터를 조사하였고, 그 결과 다음과 같은 데이터를 모을 수 있었다.- footba..
5. [Python] 나만의 문제 설계하기 1. 문제 설계 배경최근에 오일러 회로에 대해 공부하게 되었는데, 특정 그래프가 오일러 회로인지를 판별하는 필요충분조건이 매우 간단하다는 점이 인상깊었던 기억이 있다. 이때 특정 그래프가 주어졌을 때 오일러 회로를 구하는 알고리즘도 있지 않을까라는 생각을 했고, 이로부터 오일러 회로를 구해서 풀 수 있는 프로그래밍 문제를 설계해보기로 했다. 2. 문제 설계제목: 전곽이의 사탕 찾기를 도와줘! (시간 제한: 3초) 문제: 전북과학고에 재학 중인 전곽이는 다른 과학고와 함께 진행하는 미션 계주 대회에 전북과학고 대표로 참가하게 되었다. 이 미션 계주는 N개의 장소가 있는 주어진 코스에서 모든 S개의 길에 각각 하나씩 숨겨져 있는 사탕을 찾고 시작점으로 돌아오는 것이었다. 길을 제대로 찾지 못하여 각각의 길을..
[정융탐] EPL 축구 경기 승부예측 AI 개발 프로젝트 (3) 1. 모델 개발 및 시행착오 가. LSTM세웠던 계획에 따라 먼저 저번 달에 전처리한 데이터를 바탕으로 RNN 기반인 LSTM 모델부터 학습시켜 보았다. 먼저, 학습 데이터셋은 현재 2005년부터 2023년까지 순서대로 정리되어있는 상태이고 그 팀명과 연도도 열에 포함이 되어있다. 그러나 데이터의 순서가 연도를 나타내고, 그 데이터의 승률, FIFA 평점 등이 그 팀을 특정지으므로 연도와 홈/어웨이 팀명은 학습에 필요가 없다. 따라서 연도와 홈/어웨이 팀명은 훈련 데이터에서 제거하였다. 이후 label 데이터에서 각각의 라벨은 H(홈 팀 승리), A(어웨이 팀 승리), D(무승부) 이렇게 3개로 모두 문자로 되어있다. 따라서 StringLookup 레이어를 사용하여 문자열 라벨을 인덱스로 변환했다. 한편..
4. [Python] 객체지향 프로그래밍: One-card game 1. 객체지향 개념 설명객체지향 프로그래밍(Object-Oriented Programming, OOP)은 프로그램을 객체(object)라는 단위로 나누어 개발하는 방식이다. 객체는 데이터(속성)와 이를 조작하는 코드(메서드)를 포함하고 있으며, 이들을 통해 프로그램의 구조와 기능을 정의할 수 있다. 객체지향 프로그래밍의 주요 개념으로는 클래스(class), 객체(object), 상속(inheritance), 다형성(polymorphism), 캡슐화(encapsulation), 추상화(abstraction) 등이 있다. 각각의 개념에 대해 파이썬을 이용하여 개념을 구현하는 예제 코드를 덧붙여서 설명하겠다.클래스(Class)클래스는 객체를 생성하기 위한 청사진(또는 틀)이다. 클래스는 속성(데이터)과 메서드..
[정융탐] EPL 축구 경기 승부예측 AI 개발 프로젝트 (2) 1. 데이터 수집 및 전처리현재 보유한 데이터와 본 탐구에서 AI 모델별로 개발 과정에서 이용할 데이터는 각각 다음과 같다. - 승부 예측 인공지능보유한 데이터: 년도별 프리미어리그 경기 결과 데이터(1993-2024), 년도별 선수들의 피파 능력치(전체 능력치 및 세부 능력치, 2005-2024)이용할 데이터: 각각의 팀의 FIFA rating 평균 및 최고 rating, 각각의 팀의 홈/어웨이 승률- 스코어 예측 인공지능보유한 데이터: 년도별 프리미어리그 팀들의 xG 값(2016-2024), 년도별 프리미어리그 경기 결과 데이터(1993-2024), 년도별 선수들의 피파 능력치(전체 능력치 및 세부 능력치, 2005-2024)이용할 데이터: 각각의 팀의 FIFA rating 평균 및 최고 rating..