data-engineering
data-engineering copied to clipboard
Results
3
data-engineering issues
Sort by
recently updated
recently updated
newest added
아래 부분에서 에러가 발생 합니다. lines.repartition(2).first()로 하면 정상 수행됩니다. 사양문제 같은데 정확한 원인을 알고 싶습니다. [>> Source header = lines.first() ](https://github.com/keon/data-engineering/blob/f7f9d0bb15584b916d421f2f4ab46c15c8a96379/01-spark/count_trips.py#L15) **Error Log** Job aborted due to stage failure: Task...