General Information

[AI] 여러 가지 AI 서비스 리스트 정리

PLAI 2023. 4. 16. 16:51

AI를 활용한 굉장히 다양한 서비스가 출시되고 있다. 그런 서비스들에 어떤 것들이 있는지 정리하였다. 종종 업데이트 예정.

 

이미지 및 영상

생성형 AI

  1. 미드저니 (https://www.midjourney.com/): 이미지 생성 AI. 한 경연에서 미드저니를 활용하여 만든 작품이 수상해서 큰 관심을 받았다.
  2. Dalle2 (Open AI): 이미지 생성 AI
  3. Stable Diffusion (Stable AI): 이미지 생성 AI
  4. Adobe Firefly: Adobe사에서 출시한 AI 그림 생성기로, 모델을 학습할 때 저작권에 걸리지 않는 그림만 사용하였다고 한다. 또한 굉장히 다양한 기능들을 깔끔한 UI를 바탕으로 이용해볼 수 있다.
  5. Gen-2 (Runway): Stable Diffusion의 초기 개발사인 runway가 개발한 영상 생성 AI

 

그 외

  1. D-ID: 인물 사진을 영상으로 만들어주는 서비스 (https://www.d-id.com/). 인물 사진을 입력으로 넣어주면 이를 바탕으로 특정 스크립트를 읽어주는 듯한 영상을 만들어 준다.b해리포터-발랜시아가 영상도 위 서비스를 바탕으로 만들어졌다고 한다.
  2. Animated Drawings: 현재 데모 버전으로 (https://sketch.metademolab.com/canvas), 그림을 정해진 동작에 따라 움직이게 만들어줄 수 있다. 아이들 놀이로 이용하거나, 게임 캐릭터 동작으로 만들 때 이용해볼 수 있을 것 같다.
  3. Segment Anything: Meta에서 개발하고 있는 프로젝트로 (https://segment-anything.com/demo), 그림이나 영상에서 구분되는 물체를 알아서 구별해준다. 사진에서 인물을 제거하고 싶을 때 사용해볼 수 있다 (제거하고 남은 부분은 포토샵에서 채워넣을 수 있다).

 

소리

생성형 AI

  1. MusicLM: Google Research에서 개발한 text를 음악으로 바꿔주는 AI (text to music)이다. 예를 들면 일렉 기타로 연주하는 아케이드 게임 음악을 만들어달라고 하면 정말 그런 느낌의 음악을 만들어주는 방식이다. 현재 모델 자체는 공개되어 있지 않지만 해당 모델로 만든 더 많은 예제들은 MusicLM 예제 사이트 (https://google-research.github.io/seanet/musiclm/examples/)에서 확인할 수 있다.

 

그 외

  1. ElevenLabs: 해당 서비스는 (https://beta.elevenlabs.io/) 특정 목소리가 든 소리 파일을 AI 모델에 학습시키면 학습된 목소리로 텍스트를 음성으로 바꿔줄 수 있다.
  2. Typecast (https://typecast.ai/kr): 개성있는 TTS 서비스
  3. Google TTS: 구글의 TTS 서비스 (https://plai.tistory.com/35)

 

텍스트

생성형 AI

  1. ChatGPT: 텍스트 생성 AI를 활용한 채팅 서비스

 

 

 

반응형