데이터는 수위를 예측하기 위해 상,하류에 있는 대교들의 수위 및 유량과 이러한 대교들의 수위를 관리하는 팔당댐 관련 데이터들, 인근지역의 강수량을 사용하였다.
팔당댐 : 현재수위, 유입량, 저수량, 공용량, 총 방류량
청담대교, 한강대교, 행주대교, 잠수교,팔당대교,중랑교,광진교,전류리 수위, 유량
강화대교 조위
대곡교,진관교,송정동 강수량
팔당댐 관련 제원, 대교의 수위와 유량, 인근 지역 강수량의 경우 한강홍수통제소의 API 키를 발급받아 크롤링하였고,
강화대교 조위의 경우 바다누리해양정보서비스의 API 키를 발급받아 크롤링하였다.
한강홍수통제소 홈페이지를 방문해 주셔서 고맙습니다 : Welcom to HRFCO(Han river flood control office)
디렉토리에 .env 파일을 생성하여 자신의 api 키를 입력해놓으면 데이터를 수집할 때 해당 키를 불러와서 사용된다. 이후 git ignore에 .env 를 등록하여 실수로 api key가 유출되지 않도록 하였다.

아래와 같이 data_source.txt에 자신이 수집하고자 하는 데이터의 유형과 이름 관측소 코드를 적고 Collect_data.py를 실행시키면 데이터가 수집될 수 있도록 구현하였다.
(관측소 코드는 api를 호출하는데 사용되며, 한강홍수통제소, 바다누리해양정보서비스에서 얻을 수 있다.)

data_source.txt 에 수집하고자 하는 데이터를 작성한후 Collect_data.py 를 실행시켜 수집하고자하는 유형, 시작일 ,종료일을 입력하면 데이터가 유형(bridge,dam,rf)와 위치 , 기간 별로 저장된다.

