본문 바로가기

정보

R을 이용한 논문 작성법│국가 간 무역 패턴을 설명하는 중력모형

국제 무역의 패턴을 분석하고 예측하는 데 널리 활용되는 중력모형의 개념, 실증 분석을 위한 자료 수집 방법 및 R을 이용한 통계적 검정과 해석까지 정리하여 공유하겠습니다. 현재 포스팅 일자는 11월 17일이며, 이후 포스팅 내용은 수시로 업데이트될 수 있습니다.  

 

AI 논문 무료 요약 │smallpdf 사용법 │AI를 이용한 논문 작성법 (1)

AI를 이용한 논문 작성법 포스팅 중 논문을 무료로 요약할 수 있는 서비스들을 먼저 정리하여 공유하겠습니다. 논문 작성의 시작은 국내외 선행 연구들을 정리하고, 해당 연구가 시사하는 바를

e-datanews.tistory.com

 

HS Code 검색 방법 │수출입 무역 데이터│KOTRA 무역투자 빅데이터 트라이빅 │2024

전 세계 수출입 무역 동향 분석에 필요한 통계 데이터와 시장 조사 보고서 등을 제공하는 KOTRA의 무역투자 빅데이터 서비스, 즉 트라이빅 사용 방법을 간단히 살펴보겠습니다. 먼저, 상품 키워드

e-datanews.tistory.com

 

[카드뉴스] 무료 데이터 시각화 도구 │히트맵 작성법 │Datawrapper 사용법

[카드뉴스] 무료 데이터 시각화 도구 │히트맵 작성법 │Datawrapper 사용법 이번 포스팅은 지난 포스팅에 이어서 무료 데이터 시각화 도구를 이용하여 코딩하지 않고, 데이터 시각화 하는 방법을

e-datanews.tistory.com

 

PDF 번역 및 요약 PDF | 논문 작성을 위한 퍼플렉시티 AI 활용 1편

퍼플렉시티 AI(Perplexity AI)는 기계학습과 자연어 처리 기술을 활용하여 ChatGPT처럼 사용자와 대화하는 형식으로 필요한 정보를 제공합니다. 지난 1월 5일 아마존 창업자인 제프 베이조스가 구글에

e-datanews.tistory.com

 

클로드 3.5 소네트 업데이트│강의 준비 논문 작성 지원 도우미

지난 6월 20일 앤트로픽은 클로드 3.5 모델 중 소네트 출시를 발표한 바 있습니다. 이번에 먼저 업데이트 공개된 소네트는 클로드 모델 중 오퍼스와 하이쿠의 중간 모델인데요. 뉘앙스, 유머를 파

e-datanews.tistory.com

 

1. 개념

중력모형은 물리학의 만유인력 법칙에서 착안한 국가 간 무역 흐름을 설명하는 경제 모형입니다. 해당 모형은 두 국가 간 무역량이 각 국가의 경제 규모(GDP)에 비례하고, 두 국가 간의 거리와는 반비례한다고 가정합니다. 결국  경제 규모가 클수록 거리가 가까울수록 국가 간 무역량이 증가한다고 볼 수 있습니다. 

 

2. 자료 수집과 데이터셋

중력모형을 설계한 후, 실증하기 위해서는 실제 자료를 수집해야 하는데요. 무역량, GDP와 거리뿐만 아니라 이 외에 중력모형 분석에 많이 활용되는 자료들의 출처들을 모아서 정리해 보면 다음과 같습니다. 

  • 첫째, 무역량 데이터
    전 세계 국가 간 무역 데이터를 제공하는 웹사이트는 UN Comtrade, ITC Trade Map이 대표적입니다만, ITC Trade Map 서비스는  UN Comtrade 무역 데이터를 끌어와 제공한다는 점에서 출처는 같습니다. 

  • 둘째, GDP 데이터
    World Bank의 World Development Indicators는 국가별 GDP 등 다양한 경제 지표 데이터를 제공하며, IMF에서도 세계 전망 데이터를 통해 세계 각 국의 GDP를 확인할 수 있습니다. 연구에 따라서는 GDP 디플레이터를 사용하는 경우도 있으므로 참고하시기 바랍니다. 

  • 셋째, 거리 데이터 
    보통은 국가의 수도 간 직선의 거리를 이용하는데요. CEPII의 GeoDist Database를 가장 많이 이용하며, 최근에는 구글맵의 거리 매트릭스 API, DistanceFromTo 등을 사용하기도 합니다. 

  • 넷째, 인구수 
    World Bank 등의 Population Data를 활용할 수 있습니다. 

  • 다섯째, 공용어 
    공용어가 동일한 경우 의사사 소통 비용이 감소하여 국가 간 무역에 긍정적인 영향을 미치기도 하고, 큰 범주 내에서 사회문화적 동질성의 대용변수로 활용되기도 합니다. 관련 데이터는 Ethnologue에서 확인할 수 있습니다. 

  • 여섯째, 국경 접촉 여부
    국경을 접한 국가 간의 무역이 일반적으로 더 활발한데요. 관련 데이터는 CIA의 World Factbook에서 국가 간 국경 데이터를 확인할 수 있습니다. 

  • 일곱째, FTA 체결 여부
    자유무역협정의 체결 여부는 무역 장벽을 낮추는 주요 요인으로서 WTO의 Regional Trade Agreements Database에서 국가 간 FTA 채결 여부를 확인할 수 있습니다. 

  • 여덟째, 관세율 
    관세는 무역 비용에 직접적 영향을 미치는 변수인데요. World Bank의 관세 및 무역 데이터(WITS)에서 확인가능합니다. 

  • 아홉째, 식민지 관계 
    과거 국가 간 식민지 관계는 현재 무역 관계에도 지속적인 영향을 미치는 변수 중에 하나입니다. 관련 자료는 CEPII의 Colonial History Database에서 확인할 수 있습니다. 

  • 열 번째, 방위산업 및 상호군수협력 관련 협정 
    최근 전략물자 수출에 관한 이슈가 쟁점화되면서 관련 변수에도 국내 관심이 커지고 있는데요, 관련 데이터는 국내 방위사업청의 연도별 통계연감에서 수집가능합니다. 

  • 열한 번째, 경제자유도
    프레이저 연구소의 경제자유도 조사 결과는 5 개 평가 항목을 종합한 지수로서 정부 규모, 재산권 보장정도, 건전한 자본 유통, 국제 무역 자유도, 자본, 노동시장 및 사업 활동에 대한 규제 수준 등을 포괄한다. 

이 외에도 연구자의 조작적 정의에 따라 다양한 변수들이 연구모형에 추가될 수 있을 텐데요. 관련 변수와 데이터 출처는 지속적으로 업데이트하겠습니다.

 

3. 패널 데이터셋 예시

패널 중력모형 분석을 위한 연구 대상과 기간이 정해졌다면, 실제 통계적 검정을 실시하기 위하여 자료를 수집하고 엑셀 혹은 CSV에 입력 및 저장해야 합니다. 가령, 일본 내각부(2022)의  정책과제 분석 시리즈 2의 제3장 EPA/FTA무역량에 대한 효과 추계 보고서를 참고하여 가상의 패널 데이터를 구성하면 다음과 같습니다. 즉 구체적인 패널 데이터 입력 형식은 아래 업로드한 CSV 파일 양식을 참고하시기 바랍니다. 

mock_gravity_panel_data.csv
0.11MB

파일을 열어보면, 10개 국가들의 10년 치 가상의 패널 데이터 자료로 구성되어 있는데요. 변수명의 경우 trade는 두 국가 간의 무역량, gdp_c1는 수출국의 GDP, gdp_c2는 수입국의 GDP,  distance는 두 국가 간의 거리(km),  common_language는 공용어 동일 여부로서 동일하면 1이고, 아니면 0입니다. 이 외에도 shared_border는 국경 접촉 여부, fta는 자유무역협정 체결 여부, tariff는 관세율, colonial_relation는 과거 식민 관계 여부를 각각 나타냅니다. 업로드한 CSV 패널 데이터 양식을 참고하여 연구 목적에 맞도록 수정하여 사용하면 되겠습니다. 

 

4. 기본 패널 모형 형태 

기본 패널 모형의 형태는 다음과 같이 나타낼 수 있습니다. 

패널 데이터를 이용한 선형 회귀 모형
패널 자료를 이용한 선형 회귀 모형

여기서 오차항은 그룹(개인)에 따라서만 달라지는 요인과 그룹(개인)과 시간에 따라 모두 달라지는 요인으로 구분할 수 있습니다. 가령, 시험 성과는 눈에 보이지는 않으나 개인의 뛰어난 역량 요인, 그리고 이러한 개인 역량과 시험 당일 개인의 컨디션 요인에 따라 달라질 수 있다는 의미로서 수식으로는 다음과 같이 나타낼 수 있습니다. 

오차항의 구분
오차항의 구분

pooled OLS의 경우는 전자 요인인 개인의 뛰어난 역량요인을 제외하고 전체 데이터를 이용하여 OLS를 실행합니다. 고정효과 모형에서는 개인 역량 요인이 독립변수와 상관관계가 있어 개인별 더미변수로 처리하거나 Within-group 변환을 통해 모형에서 제외시킬 수도 있습니다. 마지막으로 임의효과 모형에서는 개인 역량 요인이 독립변수와 독립인 확률변수로 보고 GLS를 적용합니다. 

 

3. 통계적 검정과 해석 : 고정효과 모형  

고정효과 모형(Fixed Effects Model)은 개별 관측(개인)에 고유한 시간 불변 효과를 통제합니다. 즉 모든 시간불변(time-invariant) 변수(가령, 성, 인종 등)의 효과 추정이 불가하며, 앞서 예시한 눈에 보이지 않는 개인 역량 요인 등은 각 응답자의 "고정"된 효과로 보고 모형에서 통제합니다. 

R을 이용한 패널 중력모형 통계적 검정과 해석 : 고정효과 모형
R을 이용한 패널 중력모형 통계적 검정과 해석 : 고정효과 모형

 

4. 통계적 검정과 해석 : 임의효과 모형

임의효과 모형은 개별 관측치 간의 차이를 확률 변수로 간주하여 시간불변(time-invariant) 변수의 계수 추정도 가능하고, 개별 관측치 간 상이한 특성이 모형에 확률적으로 반영됩니다. 

R을 이용한 패널 중력모형 통계적 검정과 해석 : 임의효과 모형
R을 이용한 패널 중력모형 통계적 검정과 해석 : 임의효과 모형

 

5. 하우스만 검정

하우스만 검정을 통해 고정효과 모형과 임의효과 모형 중 적합한 모델을 선택합니다. 귀무가설은 "임의효과 모형이 적합하다."입니다. 결국 특정 유의 수준과 p-value를 비교하고, 만일 p-value가 특정 유의 수준보다 작으면, 귀무가설이 기각되어 고정효과 모형을 선택합니다. 

R을 이용한 패널 중력모형 통계적 검정과 해석 : 하우스만 검정
R을 이용한 패널 중력모형 통계적 검정과 해석 : 하우스만 검정

 

6. R 코드 파일 다운로드 

아래 파일은 무역액과 GDP, 거리 변수까지 포함한 패널 중력모형 통계적 검정을 위한 R 코드 파일입니다. 앞서 소개한 FTA 체결 여부, 국경인접 여부 등 추가 변수를 패널 중력모형에 입력하는 경우, 각 R 코드에 해당 변수명 추가하면 패널 중력모형을 이용한 통계적 검정이 가능합니다. 

R을 이용한 패널 중력모형의 통계적 검정과 해석.txt
0.00MB

 

AI 포스터│무료 행사 세미나 포스터 자동 제작 │Piktochart AI Poster Maker

픽토차트(Piktochart)가 제공하는 AI 서비스 중 포스터를 무료로 자동 생성하는 방법을 정리하고, 마지막 사용 후기에서는 이용 시 유의사항과 아쉬움 점도 공유하겠습니다. 사용 방법은 매우 직관

e-datanews.tistory.com

 

학회 세미나 전시회 포스터 무료 다운로드 ppt 템플릿 │SlideModel

학회 세미나 혹은 전시회, 이벤트에 사용할 수 있는 파워포인트 포스터 템플릿입니다. 이걸 처음부터 만들려면 상당히 귀찮습니다. 제공된 템플릿을 기초로 몇 가지 아이디어를 첨부하여 수정

e-datanews.tistory.com

 

학회 포스터 초간단 제작 방법│캔바 │AI QR 생성도 함께

이전 포스팅에서도 소개한 바 있습니다만, 캔바는 온라인으로 정말 다양한 시각화 작업을 지원하는 서비스입니다. 다양한 템플릿도 제공하고 있기 때문에 클릭 몇 번만으로 다양한 작업이 가능

e-datanews.tistory.com

 

인포그래픽 AI 사용법 │Text to Infographic │AI Infographic Generator

AI Infographic은 텍스트를 기반으로 인포그래픽 디자인을 생성해 주는 AI 서비스입니다. 메일로 서비스 가입 후, 무료로 테스트해 볼 수 있는 2개의 크레디트가 제공되므로 관련 서비스 사용법에 관

e-datanews.tistory.com

 

7. 마무리

이번 포스팅에서는 R을 이용한 논문 작성법 첫 번째 포스팅으로서 국가 간 무역 패턴을 설명할 때, 많이 활용되는 중력모형의 통계적 검정 방법을 설명하였습니다. 고정효과와 임의효과 모형으로 구분하고, 보다 적절한 모형 선택을 위한 하우스만 검정까지 소개하였습니다. 경우에 따라서는 Pooling를 모형을 이용하는 경우도 있는데요. model 옵션을 pooling으로 변경하기만 하면 됩니다. 즉, model = "pooling"으로만 변경하고 R을 실행하면 통계적 검정 결과를 얻을 수 있습니다. 또한 Breusch-Pagan 테스트를 통해 "pooled OLS"와 "Random Effects" 모델을 비교한 후, p-value가 특정 유의 수준(가령, 0.05) 보다 작다면 임의효과( andom Effects)모형을 선택합니다(해당 내용은 위에 업로드한 "R을 이용한 패널 중력모형의 통계적 검정과 해석" 파일에 기재되어 있음). 마지막으로 앞서 자세히 소개하지는 못했습니다만, CEPII에서는 보다 다양한 사례들이 제공되고 있으니 시간을 두고 자세히 살펴보시기를 권합니다.