DK STORY

고차원 데이터를 2D/3D로 시각화해주는 사이트와 오토인코더

ARONGE 2025. 11. 18. 13:32
반응형

http://projector.tensorflow.org/

 

Embedding projector - visualization of high-dimensional data

Visualize high dimensional data.

projector.tensorflow.org

 

  • 워드 임베딩(Word2Vec, GloVe), 이미지 특징 벡터, 신경망의 내부 표현 같은
    고차원(수백~수천 차원) 데이터들을
    👉 2D 혹은 3D로 줄여서 직접 눈으로 확인할 수 있게 해줌
  • 데이터를 올리면 점들이 공간에 뿌려지고,
    비슷한 의미를 가진 것들이 서로 가까이 모여있는 걸 볼 수 있음

  • 머신러닝 모델이 데이터를 어떻게 이해하고 있는지 분석할 수 있음
  • 어떤 데이터들이 서로 비슷한지, 군집 형태를 확인 가능
  • 모델에 이상한 학습이 있는지 시각적으로 점검할 수 있음

  • 텍스트 분석 콘텐츠 만들 때 단어 간 의미 관계를 시각화할 수 있음
  • 대규모 이미지 프로젝트라면 이미지 특징 공간을 3D로 예쁘게 시각화해서
    영상 콘텐츠로 활용하기도 좋음
  • AI 모델 분석 과정 자체도 콘텐츠로 만들기 좋음

 


https://n8programs.com/mnistLatentSpace/

 

MNIST Latent Space

Made by using tensorflow.js to train an autoencoder on the MNIST dataset. Drag the circle around to explore the latent space of digits.

n8programs.com

🖼️ 이 사이트의 기능

  • 이 사이트는 MNIST dataset(손으로 쓴 숫자 이미지 데이터셋)을 이용해서
    TensorFlow.js 기반으로 만들어진 오토인코더(autoencoder) 모델을 실행하는 웹 애플리케이션. n8programs.com
  • “latent space(잠재 공간)”라는 개념을 시각화해서 보여줌:
    • 오토인코더가 이미지(숫자 0-9)를 압축해서 낮은 차원의 공간으로 표현.
    • 사용자는 그 잠재 공간 내에서 마우스로 점(circle)을 드래그해서 위치를 바꿔볼 수 있고,
    • 위치를 바꿀 때마다 어떤 숫자 이미지가 나오는지 실시간으로 변화가 보여짐. (즉, latent vector 조작 → 어떤 숫자가 나타나는지)
  • 요약하자면: 이미지 데이터를 압축된 표현(latent vector)에서 탐색해보고, 그 표현이 실제 이미지 결과로 어떻게 연결되는지 직관적으로 보여주는 사이트.

✅ 왜 이게 흥미로운가?

  • 이런 ‘latent space 시각화’는 “AI가 데이터를 어떻게 구조화해서 이해하는지”를 보여주는 좋은 데모가 됨.
  • 숫자 이미지처럼 단순한 데이터로 시작하니까 ‘잠재 공간이란 무엇인가’, ‘모델은 차원을 줄이면 어떻게 작동하는가’를 쉽게 설명할 수 있음.
  • 만약 콘텐츠로 “AI 내부는 이렇게 생겼다!” 같은 시리즈 만들면 시각적으로 아주 매력적인 자료가 될 수 있음.

⚠️ 참고할 점

  • 데이터가 MNIST라서 단순하고 흑백 손글씨 숫자여서, 실제 복잡한 이미지나 영상에 적용할 때는 ‘이 정도로 깔끔하게 보인다’는 보장이 없다.
  • 웹 브라우저 기반이라서 모델 규모, 실시간 반응성, 해상도 등이 제한적일 수 있다.
  •  
반응형