In [1]:
import pandas as pd

# mode, model_name, fold_group 설정
mode = 'td_unit'  # 원하는 모드를 설정하세요
model_name = 'google/t5-efficient-tiny'  # 모델 이름을 설정하세요
recall_by_group = {}

# 그룹 1부터 5까지 처리
for group in range(1, 6):
    # CSV 파일 경로 설정 (model_name 포함)
    debug_output_path = f"0.dresult/{mode}/{model_name}/{group}/test_p.csv"
    
    # CSV 파일 로드
    try:
        df = pd.read_csv(debug_output_path)
    except FileNotFoundError:
        print(f"File not found: {debug_output_path}")
        continue

    # 1. MDM이 True인 항목만 필터
    filtered_df = df[df['MDM'] == True].copy()

    # 2. p_thing과 p_property가 thing과 property와 같으면 TP로 설정 (loc 사용)
    filtered_df.loc[:, 'TP'] = (filtered_df['p_thing'] == filtered_df['thing']) & (filtered_df['p_property'] == filtered_df['property'])

    # 3. TP 갯수와 전체 MDM 갯수로 Recall 계산
    tp_count = filtered_df['TP'].sum()
    total_count = len(filtered_df)

    # Recall 계산
    if total_count > 0:
        recall = tp_count / total_count
    else:
        recall = 0

    # 그룹별 Recall 저장
    recall_by_group[group] = recall

# Recall 출력
for group, recall in recall_by_group.items():
    print(f"Group {group} Recall: {recall:.6f}")


Group 1 Recall: 0.947941
Group 2 Recall: 0.902804
Group 3 Recall: 0.970884
Group 4 Recall: 0.965271
Group 5 Recall: 0.949611
