Skip to content

이미지와 정보량

정보량이라는 개념에 대해 익혀봅시다.

개요

코멧의 일부 캐릭터에서는 "이미지를 수백 장씩 넣었다" 라는 캐릭터가 존재합니다.
분명히 수백 장에 대한 설명을 일일이 넣으면 프롬프트가 넘칠 수밖에 없는데, 어떻게 된 걸까요?

정보량

정보량은 문자 그대로, 정보의 양을 의미합니다.
아래 예시를 살펴봅시다.

markdown
- 사과
- 사과
- 사과
- 바나나
- 바나나
- 바나나
- 딸기
- 딸기
- 딸기

여기서 과일의 종류라는 정보가 필요하다고 할 때, 우리는 9개의 데이터가 모두 필요하지 않습니다.
중복되는 데이터를 제거하고 난다면, 정보는 3개만 남게 되므로 우리는 종류가 3개라고 답합니다.

우리가 프롬프트에 필요한 건 이 바구니에 있는 과일의 종류에 가깝습니다.
이 경우, 9개의 정보를 모두 담을 필요 없이 3개의 정보만 담으면 됩니다.

예시

아래와 같이 이미지를 9장 뽑았다고 가정해 보겠습니다.

markdown
- A가 웃는 이미지
- A가 우는 이미지
- A가 화내는 이미지
- B가 웃는 이미지
- B가 우는 이미지
- B가 화내는 이미지
- C가 웃는 이미지
- C가 우는 이미지
- C가 화내는 이미지

이 경우, 우리는 이미지 설명에 대한 정보량을 단 3개로 줄일 수 있습니다.

먼저 중복되지 않는 정보만 파편화하여 추려냅니다. 그렇다면 아래와 같이 6개의 데이터를 추출할 수 있습니다.

markdown
- A
- B
- C
- 웃는 이미지
- 우는 이미지
- 화내는 이미지

여기서 3개를 더 줄이는 방법으로, 캐릭터의 이름 정보까지 모두 날려버립니다.

왜 가능할까요? 이유는 다름아닌, 캐릭터의 이름은 어차피 나중에 나올 것이기 때문입니다.
캐릭터가 존재할 것이므로 이미지가 있을 것입니다. 따라서 중복으로 캐릭터 이름을 명시해줄 필요가 없습니다.

이렇게 설계한다면, 캐릭터가 몇 명이든 상관없이 정보량은 오직 감정 개수에 따라서만 변하게 됩니다.
캐릭터가 많아지면 많아질 수록, 이미지 수에 비해 정보량은 훨씬 적어지니 수백 장의 이미지가 가능한 것입니다.