<데이터로 보는 법률>

법률 데이터 분석 사례와 정책선도자로서의 NPO 활동가에 대한 함의
https://www.youtube.com/watch?v=JRiCsrNJujc
서울대 행정대학원 박사과정
국회예산정책처 김재윤

법률의 어떤 부분을 데이터로 뽑아낼 것인가

참고, 김재윤 님의 파이콘 2019 발표 내용

입법생산성의 역설
1) 입법의 양 s. 질: 베끼기 형태 분석
2) 너무 복잡해서 실패하는 시스템
3) 사법정의의 입법적 배경: 과잉범죄화
4) 토건 클러스터의 등장

국회 입법예고

문서 유사도 검사 + 키워드 검사 tf idf 

> 20글자 이상 의견들의 상호 문서 유사도 값을 구하고, 최고값이 95% 이상인 의견에 대해서 특유의 키워드가 있는지 검사

공천에 법안 실적이 들어감. 그래서 통과되기 쉬운 법안을 마구 올림


# 법률과 데이터

* 전통적 숫자 데이터

  • 사법 통계
  • 의안 통계
  • 투표 데이터
  • 예산심사 통계
  • 법률, 정책별 데이터 
* 텍스트 데이터 
  • 법률
  • 의안원문
  • 판례
  • 회의록
  • 입법예고, 국민청원
  • 검색트렌드
  • SNS 
벌률 현상의 많은 부분을 데이터로 변환시키고, 분석할 수 있는 시대. 

심지어 법률 역사 연구에도 사용되고 있음 


* 양적 법률연구의 경향 
  • 법경제학
  • 인공지능과 법률
  • 실증법학(ELS)
  • 계산법학(Computational Legal Studies)
  • 데이터 사이언스와 법률


사람들이 의견 내면 이게 입법에 어떤 영향 미치나. 회귀분석 돌려야. 


국회 입법생산성의 폭발적 증가. 
통상 입법생산성이 높으면 좋다고 보지만, 실제로 일해보니 그렇지 않더라. 
성과 내기위해 해버리는 


TF-IDF(Term Frequency ) ~~~ 
파이썬에서 쉽게 할 수 있음 : 자연어를 은는이가 뺴고 형태소로 구분하는 것만 잘 하면 쉬워짐. 

형태소 분석기. 




if keywords[0] in text: 
  ㅣㅐㅊ = ㅅㄷㅌㅅ.랴ㅜㅇ(ㅏ됴잭ㅇㄴ[0]_
 


형벌 지수. 


형벌 강도. 형벌 양적. 

형벌 감경. 
가벼운 형벌이 더 빨리 늘어나면서 평균이 낮아지는 착시효과가 나타난 것으로 보임



~에 따르면, 
법률간 인용 관계를 네트워크라고 보고 분석할 수 있음. 
네트워크 노드 = 법률, 
네트워크 링크 = 법률간 인용 


특별법 도입된 후 가장 많이 인용된 법률 : 국토개발법(?), 간척법 등 환경 파괴 행위 프리패스하는 법률들 



판례 비공개 문제. 
현재 대법원 판례 위주로 7만건이 공개되고 있으며, 이는 전체 판례의 0.1% 수준 

이거 공개되면 판사들 일하는거 감시할 수 있음. 

법안 데이터 분석 : 캣벨