전체 글125 문자열 리스트 조작 my_list = [ 'I', 'am', 'a', 'boy' ] 스페이스를 넣어 붙이기 my_list_str = ' '.join(my_list) -> 'I am a boy' 인덱스로 뽑아내기 # list 에 있어서 범위밖의 인덱스를 지정하면 예외 발생 my_str = my_list[10] (x) # 레인지지정시 범위밖이라도 예외는 발생하지 않는다. my_str = my_list[6: ] -> 공백 my_list = [1, 2, 3, 4, 5] 숫자 리스트를 문자열로 변환 my_lst_str = ''.join(map(str, my_lst)) -> 12345 2024. 2. 2. 오버랩핑된 문자열 잇기 openai 의 whisper 를 이용하여 음성을 문자변환시에 한번에 변환할 수 있는 용량이 25MB 이기 때문에 이보다 큰 음성파일의 경우는 pypub 라이브러리를 이용하여 작게 분리를 해서 처리를 해야 한다. 이때 강제적으로 사이즈만큼 분리를 하면 대화중의 음성이 끊어지게 되므로 앞뒤를 약간 오버랩핑하게 하여 각각 변환을 하면 똑같은 대화 문자열이 각 음성파일의 맨 뒤와 맨 처음 오버랩핑되어 출력된다. 이 오버랩핑된 문자열을 자연스럽게 한 문장으로 만드는 방법은 아래와 같다. ( 음성파일을 분석하여 무음인 상태를 발견하여 분리하는 방법도 시도해 봤지만, 노이즈가 섞여있기 때문에 어렵다. ) string1 = 'Hello how are you' string2 = 'are you doing now?' i.. 2024. 2. 2. 10 Important Phrasal Verbs You Need To Know To Understand Native Speakers (With QUIZ) 1. Tune someone out (상대방의 말에) 귀를 막다, 무시하다. 2. Tick someone off someone을 화나게하다. 주어는 화나게하는 주체 3. Talk something(somone) up something(someone)을 아주 좋게 말하다. 4. Pile up 주어가 쌓이다. 주로 현재 진행형으로 쓰임. is piling up. 5. Mope around 주어가 (부정적으로 쓸데없이) 돌아다니다. 6. Loosen up 주어가 편안해 지다. 긴장을 풀다. 7. Kick off 주어가 시작되다. 목적어를 시작하다. 8. Horse around = Goof around 주어가 천방지축 거리다. 9. Get by (금전적으로) 그럭저럭 지내다. 10. Flip out 주어가 (긍.. 2024. 1. 30. tuple 변경하기 tuple 은 읽기만 가능하고 변경할 수 없지만 아래와 같이 트릭을 쓰면 변경이 가능하다. mytuple = ("I", "am", "korean") mylist = list(mytuple) mylist[2] = "american" mytuple = tuple(mylist) print(mytuple) -> ('I', 'am', 'american') 2024. 1. 28. 바이너리 분류 모델에 있어서 평가 항목 Confusion Matrix 샘플 결과 TP 1 FN 29 FP 0 TN 970 Accuracy (정확도) 전체 결과에 대한 True 의 비율 Accuracy = (TP + TN) / (TP + FN + FP + TN) = 971 / 1000 = 0.971 Precision (정밀도) (모델의 관점) True(=1) 이라고 예측한 것 중에 실제 True의 비율 Precision = TP / (TP + FP) = 1.0 Recall (재현율) (True 입력 데이터의 관점) True 입력데이터중에 True라고 예측한 비율 Recall = TP / (TP + FN) = 1 / 30 = 0.033 F1 Score Precision과 Recall의 밸랜스도를 나타낸다. 어느 한쪽이 극단적으로 낮으면 F1 도 .. 2024. 1. 16. 일반 데이터 학습용/테스트용 분리 지난번에는 이미지 데이터가 대상인 Data Augmentation의 ImageDataGenerator 를 이용하여 학습데이터를 분리하였다. 이번에는 단순히 pandas 로 읽어들인 숫자 문자등의 데이터를 분리해 보겠다. 1. numpy 를 이용하는 방법 import numpy as np def shuffle_and_split_data(data, test_ratio): np.random.seed(42) # np.random.permutation(length) : 랜덤으로 일련번호의 순서를 바꿈 shuffled_indices = np.random.permutation(len(data)) # 테스트 사이즈를 계산 test_set_size = int(len(data) * test_ratio) # 초반 test_.. 2024. 1. 14. 이전 1 ··· 6 7 8 9 10 11 12 ··· 21 다음