ToyProject
GCP08 :: dataflow (작성중)(2)
GCP08 :: dataflow (작성중)(2)
2020.08.14csv 파일 양식이 다음과 같이 되어있다. category, language, year data1, data2, data3 Google Cloud Storage 에서 저장되어 있는 CSV 파일을 읽어서 category language year 순으로 되어 있는 데이터를 가공해서 처리할건데 첫번째) { category : { language : 횟수, language : 횟수 } } 저장할 생각입니다. 두번째) { category : { year : language, year : language } }, 단 여기서 language 상태에서 중복을 발생시키면 데이터 사이즈가 커지므로 포함 여부를 살펴보고 존재하지 않으면 넣지 않을 생각입니다. 첫번째 아이디어 구체화) IoT, 'c, c++, python',..