ubuntu4 우분투 (Ubuntu) 클라우드 서버에서 WebUI로 Stable Diffusion 기반 Text-to-Video 모델 사용 방법 며칠 전, WebUI에서도 text-to-video (t2v) 모델을 사용해볼 수 있다는 글을 읽어 보았습니다. 하지만 아직 우분투 클라우드 서버의 WebUI를 통해서 text-to-video 모델을 사용하는 방법에 대한 글을 찾아보기 힘들어서, 직접 사용법에 대한 글을 올리게 되었습니다. 우분투 (Ubuntu) 클라우드 서버에서 WebUI로 Stable Diffusion 기반 Text-to-Image 모델 사용 방법 OpenAI의 DALL-E 시리즈가 2021년부터 나오기 시작한 게 엊그제인 것 같았는데, 지금은 누구나 손쉽게 Text-to-Image 모델을 활용해서 그림을 그리는 세상이 되었네요. 특히, 다양한 stable diffusion 모델을 dino-thinking.tistory.com 아직 .. 2023. 3. 25. 우분투 (Ubuntu) 클라우드 서버에서 WebUI로 Stable Diffusion 기반 Text-to-Image 모델 사용 방법 우분투 클라우드 서버에서 WebUI로 Stable Diffusion 기반 Text-to-Image (txt2img) 모델을 사용하는 방법에 대해 알아보겠습니다. 기존에 stable diffusion 모델을 이용해서 그림을 생성하기 위해서는 다른 사람이 생성된 모델을 다운로드받아서, python 코드를 다뤄야 했었는데요, 이런 불편함을 우리에게 친숙한 UI 형태로 다룰 수 있는 WebUI도 코드가 공유된 이후로 더 쉽게 그림을 그릴 수 있게 되었다고 생각합니다. 참고로 WebUI는 PyThon 기반이기 때문에, PyThon을 먼저 공부하고 싶으신 분들은 지금 바로 관련 강의나 책을 확인해보세요. WebUI로 Stable Diffusion 기반 Text-to-Image 모델 사용하기 전 준비사항 본격적으로 .. 2023. 3. 1. [ESPnet] 우분투 Ubuntu 20.04 LTS 에서 아나콘다 Anaconda 가상환경으로 End-to-end (E2E) 음성인식 Toolkit ESPnet 설치하기 오늘은 음성인식의 대표적인 end-to-end (E2E) toolkit인 ESPnet을 우분투 20.04 LTS의 아나콘다 가상환경 상에서 설치하는 방법을 살펴보겠습니다. ESPnet은 Shinji Watanabe라는 Carnegie Mellon 대학의 associate professor가 주도하여 만든 end-to-end 기반 음성인식 toolkit 입니다. 이분이 참여한 음성인식 오픈소스 toolkit으로 KALDI가 있죠. KALDI는 현재 샤오미에서 근무하고 있는 Daniel Povey가 주도하여 만든 Gaussian Mixture Model (GMM) 및 Deep Neural Network (DNN)의 hybrid 기반 음성인식 시스템을 구축할 수 있는 toolkit입니다. 최근에는 KALDI .. 2022. 12. 16. 우분투 (Ubuntu) 20.04 LTS에 아나콘다 (Anaconda) 가상환경 상에서 파이토치 (PyTorch) 및 TorchText 설치 및 주의점 어제는 우분투 20.04 LTS에서 아나콘다 가상환경을 설치해보았습니다. 오늘은 파이썬 3.9 버전으로 새로운 아나콘다 가상환경을 만들어보고, 파이토치 (pytorch)를 설치해보겠습니다. https://dino-thinking.tistory.com/97 우분투 (Ubuntu) 20.04 LTS에 아나콘다 (Anaconda) 가상환경 설치 해보기 오늘은 우분투 (Ubuntu) 20.04 LTS에 아나콘다 (Anaconda)를 설치해보는 과정을 설명하겠습니다. 아나콘다는 python과 R 언어 기반의 오픈소스로, 대규모 데이터 처리와 분석, 기계 학습 등에 사용되는 패 dino-thinking.tistory.com 아직 아나콘다 가상환경을 설치하지 않으셨다면, 아래 아나콘다 설치 방법을 작성한 블로그 글을.. 2022. 12. 15. 이전 1 다음