본문 바로가기
잡다한이야기

그림 그려주는 AI 플레이그라운드 AI 이용해 보기

by ohmyworld 2023. 12. 31.
반응형

 

 

그림 그려주는 AI 플레이그라운드 AI 이용해 보기

 

 

그림 그려주는 AI 이용해 보신 적 있으신가요? 오늘은 그중에서도 플레이그라운드 AI 이용하여 만든 그림을 몇 가지 올려보도록 할게요. 원하는 결과를 얻기 위해 완성도 높은 프롬프트를 입력해야 하는 것이 가장 큰 작업인 듯합니다. 

 

내가 꽂힌 주제는 신비로운 분위기였고 그에 관한 주제로 프롬프트를 생성하려고 파파고번역기도 사용해 봤어요. 아무래도 영어로 입력을 해야 더 효과적일 것 같아서요. 

 

아래 플레이그라운드 AI 사이트의 링크를 걸어두었으니 이미지를 클릭하시면 사이트로 바로 가볼 수 있습니다. 

 

그림 그려주는 AI, 플레이그라운드 AI - 출처

 

위 플레이그라운드 AI의 메인 화면을 보시면 카테고리별 이미지를 생성할 수 있어요. 다양하게 이미지를 생성하여 활용해 보시면 흥미진진한 경험이 될 듯합니다. 

 

저도 처음 그림그려주는 AI를 활용해 보고선 굉장히 신기한 경험이 되었습니다. 특히나 어린 시절부터 그림 잘 그리는 사람들을 부러워했는데 대신 그려주니 그것 또한 나쁘지 않더군요.

 

 

그림 그려주는 AI인 이 그림은 유일하게 우리말로 프롬프트를 작성했더니 의도했던 바와는 전혀 다른 작업 결과가 나왔어요. 플레이그라운드 AI도 한국어에는 서툰가 봅니다. 왜냐하면 바닷가의 소나무 관련한 내용을 입력한 후 이런 결과물이 나와버렸거든요. 

 

 

플레이그라운드 AI는 영어로 입력했을 때 의도했던 결과물에 근접한 결과물이 나왔답니다. 신비로운 물안개 호수, 신비로운 동물이 뛰어노는, 주변 숲이 무성한... 이런 내용으로 해봤어요.

 

반응형

 

 

플레이그라운드 AI의 그다음 결과물도 신비로움을 주제로 입력을 했는데 의도한 바의 약 80% 정도만 만족했습니다. 그럼에도 불구하고 '신비'의 주제는 벗어나지 않은 것 같아서 나름 쓸만한 것 같군요. 

 

 

어렸을 때 만화에서나 보던 유니콘이 떠올라 숲 속의 유니콘 두 마리가 뿔을 맞대는 그림을 그려달라고 해봤습니다. 그러나 요정, 트롤 등 아무리 입력을 해봐도 그림에는 나오질 않더군요. 플레이그라운드 AI는 트롤, 요정이라는 단어를 싫어하나 봅니다. ㅎㅎ

 

 

눈 쌓인 우거진 숲 속을 보고 싶어서 만들어 본 그림입니다. 이런 길을 걸어보는 상상을 해봐요. 사실 여기서도 요정, 트롤 같은 단어를 넣어 봤는데 절대 나오질 않네요. 제가 뭘 잘못했을까요?

 

 

폭포가 흐르는 숲 속의 어린 아이 두 명이 손잡고 걷는 내용을 입력했을 때 나온 결과물인데 나름 만화 속 한 장면 같기도 하고 동화책 속 그림 같기도 해서 마음에 들었어요. 

 

이상 그림 그려주는 AI 중 하나인 플레이그라운드 AI로 몇 가지의 작품(?)을 탄생시켜 봤습니다. 그러고 보니 그림으로 먹고사시는 분들은 걱정이 많을 것 같아요. 이대로 가다가는 그림 그려주는 AI가 화가들의 갈 곳을 잃게 만들 것 같기도 합니다. 

 

플레이그라운드 AI 외에 다른 그림 그려주는 AI 사이트도 있으니 참고하세요. 

1. DALL-E

OpenAI에서 개발한 텍스트 투 이미지(Text to Image) 모델로, 입력한 문장을 이해하고 이에 해당하는 이미지를 생성해 줍니다. DALL-E는 GPT-3와 달리 이미지를 직접 학습하지 않고, 텍스트를 통해 간접적으로 학습하였습니다.
스테이블 디퓨전(Stable Diffusion)

 

2. 스테이블 디퓨전(Stable Diffusion)

은 오픈소스 딥러닝 모델로, 텍스트나 음성 등의 입력 데이터를 받아 고품질의 이미지를 생성해 주는 텍스트 투 이미지(Text to Image) 모델입니다. 스테이블 디퓨전은 기존의 GAN과는 달리 적대적 학습 방식을 사용하지 않으며, 대신 손실 함수를 최적화함으로써 이미지를 생성합니다.


2. 미드저니(Midjourney)

미드저니는 구글에서 개발한 텍스트 투 이미지(Text to Image) 모델로, 입력한 문장을 이해하고 이에 해당하는 이미지를 생성해 줍니다. 미드저니는 스테이블 디퓨전과 마찬가지로 적대적 학습 방식을 사용하지 않으며, 대신 손실 함수를 최적화함으로써 이미지를 생성합니다.

 



위 세 가지 모델은 모두 텍스트 투 이미지(Text to Image) 모델로서, 입력한 문장을 이해하고 이에 해당하는 이미지를 생성해 준다는 공통점이 있지만, 각 모델마다 학습 방법이나 구현 방식 등에 차이가 있으며, 이로 인해 생성되는 이미지의 품질이나 특성에도 차이가 있을 수 있습니다. 

 

또한, 이러한 모델들도 완벽하게 정확한 이미지를 만들어내지는 못하므로, 결과를 참고하면서 추가적인 수정 작업이 필요할 수도 있습니다.

 

 

반응형

댓글