본문 바로가기
728x90

파이토치5

[파이토치] 파이토치로 Mel-Spectrogram 생성해보기 PyTorch의 torchaudio.transforms를 사용하여 오디오 파일에서 Mel-Spectrogram을 생성하는 방법 1. 필요 라이브러리 설치아래 명령어로 설치pip install torchaudio2. 기본적인 Mel-Spectrogram 생성 코드import torchaudioimport torchaudio.transforms as transformsimport torchimport matplotlib.pyplot as plt# 1️⃣ 오디오 파일 로드waveform, sample_rate = torchaudio.load("example.wav") # 파일 경로 입력# 2️⃣ Mel-Spectrogram 변환기 정의mel_transform = transforms.MelSpectrogram.. 2025. 2. 20.
[파이토치] 파이토치로 Convolution 이해하기, torch.nn/nn.Conv1d/nn.Conv2d torch.nntorch.nn은 PyTorch의 핵심 모듈 중 하나로, 신경망 모델을 정의하고 구성하기 위한 다양한 클래스와 함수를 제공import torch.nn as nnnn.Conv1d파이토치에서 1차원 컨볼루션 레이어를 정의하는 클래스 1차원 컨볼루션은 입력 데이터의 한 방향(주로 시계열 데이터에서는 시간 축)으로 컨볼루션 연산을 수행 2차원 컨볼루션이 가로, 세로로 모두 이동하면서 계산되는 것과 다르게 1차원 컨볼루션 연산은 가로로만 이동nn.Conv1d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1, groups=1, bias=True, padding_mode='zeros') in_channels: 입력 데이터의.. 2024. 12. 18.
[파이토치] 파이토치에서 데이터 로드하기 미니배치데이터 셔플병렬 처리파이토치에서 기본적인 데이터 로드 방법은 Dataset을 정의하고, 이를 DataLoader에 전달하는 것입니다. 텐서를 입력받아 Dataset의 형태로 변환해주는 TensorDataset 사용해보기import torchimport torch.nn as nnimport torch.nn.functional as Ffrom torch.utils.data import TensorDataset # 텐서데이터셋from torch.utils.data import DataLoader # 데이터로더x_train = torch.FloatTensor([[73, 80, 75], [93, 88, 93], .. 2024. 11. 7.
[파이토치] 선형 회귀 모델 구현하기 파이토치에서 이미 구현되어 제공되는 함수를 불러와 선형 회귀 모델을 구현하겠습니다. nn.Linear()함수를 통해 선형 회귀 모델을 불러올 수 있습니다. mse도 nn.functional.mse_loss()라는 함수로 구현되어 있습니다. 이 두가지를 불러오겠습니다. import torch.nn as nnmodel = nn.Linear(input_dim, output_dim)import torch.nn.functional as Fcost = F.mse_loss(prediction, y_train) 이처럼 임포트하여 사용할 수 있습니다. 1. 단순 선형 회귀 구현하기 우리는 y = 2x를 가정하여 구현하겠습니다.import torchimport torch.nn as nnimport torch.nn.func.. 2024. 11. 7.
[파이토치] 텐서 이해하기 벡터, 행렬, 텐서 스칼라 : 차원이 없는 값, 숫자가 1개벡터 : 1차원으로 구성된 값, 숫자가 여러개 나열 됨 (그림에서 1d-tensor)행렬 : 2차원으로 구성된 값 (2d-tensor)텐서 : 3차원 이상부터 텐서라고 부르지만 벡터를 1차원 텐서, 행렬을 2차원 텐서로 부름  2D Tensor딥러닝에서는 2차원 텐서를 batch size * dimension으로 표현함즉, 행렬에서 행의 크기가 batch size, 열의 크기가 dim. 더보기데이터 하나의 크기가 256이라면, 벡터 하나에 숫자가 256개 존재한다는 의미 만약 훈련 데이터가 총 3000개라면, 전체 훈련 데이터의 개수는 3000 * 256개batch size = 64이면, 컴퓨터는 한번에 64 * 256개의 데이터를 처리그럼 컴퓨.. 2024. 11. 7.
728x90