Discord를 사용하는 미드저니(MidJourney)와 Open Ai에서 나온 달리 2 (DALL-E2)는 최근에 사용되고 있는 AI art generator 중에서 가장 이미지의 수준이 높고 정교하다. 두 프로그램 모두 사용료를 내야 하기 때문에 2개를 모두 쓰기에는 부담이 된다, 그래서 비교를 통해 나에게 맞는 것을 선택해서 쓰는 게 좋을 거 같아 분석해 보았다.
1. Resolution
DALL-E2 1024 x 1024
MidJourney 1792 x 1024
2. 동일한 Prompt를 넣은 그림 비교
Prompt: Animated Pixar Movie about two motocylists.
첫 눈에 보기에도 스타일이 다릅니다. DALL-E2는 좀 더 만화 같은 느낌이고, 미드저니(MidJourney)는 얼굴도 그렇고 오토바이도 그렇고 형태가 정확하게 나오지 않았습니다.
Prompt: Bright summer afternoon, flowing river, lush nature, stodio Ghibli style.
'stodio Ghibli style'이라고 넣은 이유는 일본 만화 풍을 기대하고 프롬프트에 넣은 것입니다. 이웃집 토토로나 마녀 배달부 키키라던지 stodio Ghibli 에서 만든 만화 영화를 보면 특유의 스타일이 있잖아요. 그건 면에서 본다면 DALL-E2는 사진에 가까운 느낌입니다. 미드저니(MidJourney)는 하늘과 나무 그리고 물에 비친 그림자랑 색감이 'stodio Ghibli style'을 연상시키는 이미지를 내놓았습니다. 저는 미드저니 쪽 그림이 훨씬 프롬프트와 가까운 결과를 내놓았다고 보입니다.
Prompt: Intricate sulpture of a skull.
DALL-E2는 빛과 그림자의 대비가 명확해서 뭔가 드라마틱한 분위기의 이미지를 만들어 주었네요. 미드저니(MidJourney)는 섬세한 작업으로 패턴이 들어가 있고 해골인데도 아름답게 느껴지는 이미지를 만들어 주었습니다. 피사체의 위치나 배경색과의 조화에서 디자인적으로 봤을 때 훨씬 정돈된 느낌입니다.
Prompt: Spongebob Squarepants painted by Pablo Picasso, Oil painting on canvas.
DALL-E2는 원래 스펀지밥과 상당히 비슷하게 그렸네요. 프롬프트에 피카소가 캔버스에 우화로 그린 것 같이 그려 달라고 했으니, '입체파'를 흉내 낸 미드저니(MidJourney)가 프롬프트에 맞게 그려 주었다고 보여집니다. 피카소의 1937년 작품 '우는 여인'을 오마쥬한 것 같죠? 미드저니가 화가들의 화풍과 기법, 그리고 스타일 등에 대한 데이터를 가지고 있다는 걸 알 수 있습니다.
Prompt: A head of a robot hooked up with wires to the ceiling, illuminated by colored lights.
DALL-E2가 표정도 사실적이고, 디테일도 로봇 안에 있을법한 전선이 끊어진 듯한 장면으로 잘 만들어 주었네요. 미드저니(MidJourney)도 잘 만들었지만 달리 2와 비교했을 때 확실히 다른 점이 보입니다. 그런데 둘 다 형광 불빛이 미춘 듯한 느낌은 프폼프트대로 하려고 노력한 게 보입니다.
Prompt: A sea otter with a pearl earring in style of Johannes Vermeer.
왼편의 DALL-E2 그림은 해달과 '진주 목걸이를 한소녀'의 원작을 적절히 잘 묘사했다고 보여집니다. 오른쪽 미드저니(MidJourney)가 만든 이미지는 해달의 털 같은 디테일은 잘 표현했지만 원작의 그림풍과 색감고는 조금 다르게 만들어졌습니다. 혹은 원작에서 푸른빛이 아주 중요한 색감이기 때문에 그것을 강조하다보니 이렇게 된 듯 합니다. 첨언하자면 요하네스 베르메르 시대에 프란색 안료는 아주 귀하고 비쌌기 때문에 귀부인의 초상화가 아닌 그림에 파란색 안료를 쓴다는 것은 이해하기 힘든 상황이었습니다. 더군다나 이 그림을 사 갈 사람의 주문이 아닐 경우에 더욱 그렇지요. 부자들이 그림을 사 줘야 생계가 해결되던 당시 화가들의 입장을 생각해 보면 더더욱 그렇습니다. 진주 목걸이를 한 소녀가 유명해진 이유 중에 하나도 이 파란색 안료가 한몫 했으니까요. 미드저니가 이 그림의 특성을 이해하고 파란색을 사용하는 것이 프롬프트에 적합한 이미지라고 판단했다면 대단하다는 말 밖에 할 말이 없습니다.
3. 결론
DALL-E2와 미드저니(MidJourney) 모두 같은 프롬프트를 넣어도 매번 다른 그림을 그려주기 때문에 위에 보여드린 예시가 항상 나오는 것은 아님을 말씀드립니다. 그리고 위에 나온 예시를 가지고 variation을 할 경우 또 다른 결과가 나오기 때문에 위에 보신 예시들이 최종값이 아닙니다. 하지만 같은 프롬프트로 비교해 봤을 때 2개의 장단점은 어느 정도 보이는 것 같습니다.
결론은 프롬프트를 누가 자세하게 잘 쓸 줄 아느냐에 따라 원하는 결과를 얻거나 그렇지 못하거나입니다. generate(이미지 생성)을 시킬 때마다 돈을 내는 시스템이므로 한 번에 누가 제대로 된 프롬프트를 쓰는지가 관건이 될 것입니다.
'AI' 카테고리의 다른 글
ChatGPT3.5와 4 중에 어떤 걸 쓸까? (0) | 2023.03.15 |
---|---|
ChatGPT 4가 왔다! (1) | 2023.03.15 |
AI art DALL-E 2 배워보기 (0) | 2023.03.07 |
AI로 나만의 음원 만드는 방법 (0) | 2023.03.07 |
ChatGPT 월정액 30배 아끼는법 (1) | 2023.03.07 |
댓글