FAQ/자료실


  • Q

    [통계실] 누구나 의학통계상담을 신청할 수 있나요?

    A

    연구책임자가 아주대학교 의료원에 재직 중인 연구강사 이상인 경우 신청 가능하며 교내 데이터가 아닌 경우 IRB 문제로 통계상담이 불가합니다.

  • Q

    [통계실] 분석에 걸리는 총 소요시간과 분석 프로세스는 어떻게 되나요?

    A

    통계신청서 접수 후 접수 순위와 내용에 따라 담당자가 지정됩니다.
    정확한 상담일정은 담당자가 신청자의 가능한 시간을 고려하여 교수님과 조율 후 이메일로 연락드리며 홈페이지 상에도 게시합니다.

    상담완료 후 자료코딩이 확실한 시점부터 분석기간이 개시되며 분석 시작 후 3주 안에 1차 분석보고서를 받으실 수 있고 상황에 따라 최대 3차 분석보고서까시 송부 가능합니다.

    신청자와 2주이상 연락이 닿지 않는 경우 해당 상담건은 종료되고, 종료이후 통계상담을 다시 시작하시려면 신청서를 다시 작성해 주셔야 합니다.

  • Q

    [통계실] 코드북은 어떻게 작성하나요?

    A

    코드북 작성 시 아래사항을 확인 후 작성해 주시기 바랍니다.

    1)개인정보와 관련된 변수(예: 이름, 전화번호 등) 포함할 경우
    --> 비식별화 필요함. [FAQ 데이타는 어떻게 비식별화 할 수 있나요? 참고]
    2) 변수명
    --> 영문자로 시작하며, 영어와 숫자만 포함 가능함. 변수명은 띄어쓰기가 없어야 함
    예시] abc ( O ), abc12 ( O ), abc12abc ( O ), 12abc ( X ), abc 12( X )

    3) 값이 숫자인 경우
    --> 단위는 생략하며, 코드북 [변수 값, 단위 및 범위]에 단위 기입
    예시] 10kg일 경우 10

    4) 한 칸에 하나의 값만 입력
    예시] 5~10 또는 5, 10 과 같이 입력 불가

    5) 결측값(missing value)
    --> NA로 두거나 빈칸으로 둠 (결측값은 0, x, 모름 등으로 작성하지 않음)

    6) 데이터와 코드북의 변수명 통일(중요)
    ※ 작성요령에 맞지 않을 경우 다시 요청할 수 있으며, 개인정보 비식별화가 되지 않은 경우 반송됩니다.

  • Q

    [통계실] 데이타는 어떻게 비식별화 할 수 있나요?

    A

    인간을 대상으로 하는 연구의 경우, 데이타는 반드시 비식별화하여 업로드 해야 하고 비식별 조치 방법에는 가명처리, 총계처리, 데이터 삭제, 데이터 범주화, 데이터 마스킹 등 여러 가지 기법을 단독 또는 복합적으로 활용할 수 있습니다.

    보내주시는 데이타에 환자를 식별화 할 수 없도록 환자의 성명, 주민등록번호, 병록변호 등은 삭제해 주시기 바라며 비식별화 데이타가 아니면 데이타는 반송처리 됩니다.

  • Q

    [통계실] 사용가능한 데이타의 종류 및 보관기한은 얼마나 되나요?

    A

    excel,csv,spss,sas,r 데이타 모두 가능하나 엑셀보다는 csv 파일이 데이터 입력시 오류가 적어 선호하며, 분석용 데이타 및 관련자료는 접수일 기준 6개월 이후 모두 삭제 됩니다.

  • Q

    [통계실] 통계실에서 대여 가능한 통계프로그램은 무엇인가요?

    A

    현재 통계실에서 대여 가능한 프로그램은 SPSS, SAS 입니다.

    1) SPSS
    * USB, CD 대여가능
    * 개인 USB 가져오시면 설치 파일 복사해드립니다 (여유공간 5GB 이상).
    * IP 라이센스로 관리되고 있기 때문에 아주대의료원 내부 인터넷망에서만 사용가능합니다.
    (자택 혹은 aumc-guest 와이파이로 사용불가 합니다)

    2) SAS
    * 외장하드 대여가능
    * 개인 외장하드 가져오시면 설치 파일 복사해드립니다 (여유공간 30GB 이상)
    * 사용자 계정의 설정을 영문으로 변경하셔야 합니다.

    3) R 프로그램은 아래 주소에서 직접 무료로 다운 받으실 수 있습니다. R을 설치하신 후에 R-Studio를 설치하셔야 합니다.
    - R 설치 주소: https://cran.r-project.org/
    - R-studio 설치 주소: https://www.rstudio.com/products/rstudio/download/

  • Q

    [통계실] 변수의 종류는 어떻게 다른가요?

    A

    범주형 변수는 크게 명목변수와 서열변수를 포함합니다.

    명목변수란 어떤 대상의 내용이나 특성을 분류하거나 구분하기 위해 사용되며 단순히 구분하는 의미이며 숫자의 크기는 의미가 없습니다.
    예: 성별(남=1/여=0), 그룹(환자=1/normal=0).

    서열(순위)변수란 명목변수에 비해 이름 그대로 순위가 있는 척도를 말합니다.
    예: 학력(무학=0, 초등학교졸업=1, 중학교졸업=2, 고등학교졸업=3, 대학교이상=4),
    병의 severity(1=mild, 2=moderate, 3=severity)

    연속변수란 연속된 값을 같는 변수를 말합니다.
    예: BMI, 혈압, 몸무게

  • Q

    [통계실] 모수검정과 비모수 검정은 어떻게 다른가요?

    A

    1) 모수 검정 (parametric test)
    자료가 정규성 가정을 만족할 때, 모수적 특성을 이용하는 통계방법 입니다.
    이때, 정규성 가정은 자료의 히스토그램 또는 Normal Q-Q plot으로 확인하거나, Shapiro-Wilk test 또는 Kolmogorov-Smirnov test 등 통계방법으로 확인할 수 있습니다.

    2) 비모수 검정 (non-parametric test)
    정규성과 같은 자료의 분포에 대한 가정을 하지 않으며, 자료의 순위를 이용하는 통계방법이고 모수 검정에서 정규성 가정을 만족시키지 못하는 경우, 자료가 순위의 형태인 경우 또는 표본수가 적은 경우에 사용합니다.

    3) 자료 성격에 따른 모수 / 비모수 검정 방법 예
    ① 한 개의 집단 또는 짝 지은 집단: one sample t-test (paired t-test) / Wilcoxon signed rank test
    ② 두 개의 독립된 집단: two sample t-test / Wilcoxon rank-sum test (Mann-Whitney U test)
    ③ 3개 이상의 집단: one-way ANOVA / Kruskal-Wallis test
    ④ 상관분석: Pearson correlation / Spearman correlation, Kendall's tau
    ⑤ 반복측정자료: one-way repeated measured ANOVA / Friedman test

  • Q

    [통계실] 독립변수와 종속변수의 차이는 무엇인가요?

    A

    독립변수란 원인, 연구자가 조정할 수 있는 변수이고, 종속변수란 결과, 독립변수가 변화함에 따라 그 영향으로 변하는 변수입니다.

    예1: 나이, 성별, 흡연유무가 암 발생에 영향을 미치는지 알아보고자 함.
    독립변수=나이,성별,흡연유무, 종속변수=암발생여부(1/0)

    예2: 처치방법(A약/B약)에 따라에 따라 혈압이 달라지는지 알아보고자 함.
    독립변수=처치방법, 종속변수=혈압

  • Q

    [통계실] Sample size, power 란 무엇인가요?

    A

    samplesize란 연구에 참여하는 환자의 수 혹은 실험 단위를 뜻하는 의미로, 의미 있는 연구 결과 혹은 치료효과를 산출해 내기 위한 값으로 연구설계 단계에서 미리 계획 해 보는 것이 좋습니다.

    power(검정력)란 대립가설이 옳을 때 귀무가설을 채택하지 않은 확률로서 통계 분석을 통해 실제로 효과가 있는 것을 증명 할 수 있는 값으로 대부분 연구에서는 0.80을 기준으로 power는 최소 0.8이상이 되어야 합니다.