html

빅데이터 보고서 양식

연습노트 2024. 6. 24. 20:57

분석 실습 보고서 PPT 작성

분석실습 :  1분석 개요

  • 1.1 분석 배경
    • 공정(설비) 개요
    • 이슈사항(Pain point)
  • 1.2 분석 목표
    • 분석 목표
    • 데이터 정의 및 소개
    • 데이터 분석 기대효과
    • 시사점(implication) 요약기술
  • : 분석 배경
  • 내용:
    • 공정(설비) 개요
    • 이슈사항(Pain point)
  • 섹션 제목: 분석 목표
  • 내용:
    • 분석 목표
    • 데이터 정의 및 소개
    • 데이터 분석 기대효과
    • 시사점(implication) 요약기술
  • 섹션 제목: 분석 실습
  • 내용:
    • 2.1 제조데이터 소개
    • 2.2 분석 모델 소개
    • 2.3 분석 체험
  • 섹션 제목: 제조데이터 소개
  • 내용:
    • 데이터 분석 방법
    • 데이터 유형/구조
    • 데이터 (품질) 전처리
  • 섹션 제목: 분석 모델 소개
  • 내용:
    • 데이터 흐름 및 인공지능 모델 적용 흐름도
    • AI 분석모델
  • 섹션 제목: 분석 체험
  • 내용:
    • 2.3.1 소프트웨어 및 패키지 설치 방법 및 절차 가이드
    • 2.3.2 분석 단계별 프로세스 – 데이터 전처리
    • 2.3.3 분석 단계별 프로세스 – 랜덤 포레스트

슬라이드 9: 유사 타현장의 'T'와 최적화 AI 데이터셋, 분석 적용

  • 섹션 제목: 유사 타현장의 'T'와 최적화 AI 데이터셋, 분석 적용
  • 내용:
    • 목표 지점에 대한 상세 분석 및 적용 단계
  • 요약 및 다음 단계:
    • 주요 내용 요약
    • 다음 단계
    • 질문 및 답변

 분석 개요

  • 내용:
    • 공정(설비) 개요
    • 이슈사항(Pain point)
    • 분석 목표
    • 데이터 정의 및 소개
    • 데이터 분석 기대효과
    • 시사점(implication) 요약기술

 분석 배경

  • 내용: 공정 및 문제점에 대한 상세 설명
  • 디자인 팁: 관련 다이어그램이나 흐름도 사용

 분석 목표

 

  • 목표 설정
  • 데이터 정의
  • 기대효과
  • 요약기술

분석 실습

  • 제조데이터 소개
  • 분석 모델 소개
  • 분석 체험

 제조데이터 소개

  • 내용:
    • 분석 방법
    • 데이터 유형/구조
    • 데이터 전처리

분석 모델 소개

  • 내용:
    • 데이터 흐름도
    • AI 분석모델

슬라이드 8: 분석 체험

  • 내용:
    • 설치 방법 가이드
    • 데이터 전처리
    • 랜덤 포레스트

 AI 데이터셋 최적화

  • 내용: 상세 분석 및 적용 단계
  • 디자인 팁: 예제나 사례 연구 포함

 요약 및 다음 단계

  • 내용:
    • 주요 내용 요약
    • 다음 단계
    • Q&A

"분석 배경" 슬라이드 예시

제목: 분석 배경 내용:

  • 공정(설비) 개요:
    • 제조 공정 설명
    • 시각적 표현 (예: 다이어그램)
  • 이슈사항(Pain point):
    • 주요 문제점 식별
    • 공정에 대한 영향

 

  • 필요 SW: Python, Anaconda, Jupyter Notebook
  • 필요 패키지: Tensorflow, Keras, Pandas, Ortools, Scikit-learn, Matplotlib
  • 분석 환경: [운영체제] Windows 10, Ubuntu 18.04 (삭제), [CPU] Intel Xeon E5-1650 v4 3.60GHz, [RAM] 28GB, [GPU] Nvidia Geforce 1080Ti
  • 필요 데이터: okm_augmented_2021.csv

 

분석 요약

No구분내용

 

1 분석 목적 한국전력공사는 제조현장에서의 3개월 간 최대 피크 전력을 기준으로 1년간의 전기료를 부과하고 있으며, 제조공정에서 의도치 않은 최대 피크 전력 발생은 전기료 증가로 인한 제조비용을 증가시키는 요인으로 작용합니다. 따라서, 본 가이드는 관련 데이터셋과 AI 모델을 통해 실제 제조공정에서 발생할 수 있는 최대 피크 전력을 낮추는 것을 목표로 합니다. 해당 목적을 달성하기 위해 주요 변수 간의 상관관계 분석을 통해 다양한 머신러닝 방법과 알고리즘을 활용한 에너지 사용 예측 모델을 개발하여 전력 자원 최적화를 달성하고자 합니다.
2 데이터셋 형태 및 수집방법 1) 분석에 사용된 변수: 날씨, 시간, 15분, 30분, 45분, 60분, 평균, 생산량, 기온, 풍속, 습도, 강수량, 전기요금(계절), day, d, m, 공정인원, 인건비<br>2) 데이터 수집 방법: 공정 변수가 감지 센서를 활용한 데이터 수집(15분 단위)<br>3) 데이터셋 파일 형식: CSV
3 데이터 개수 및 데이터셋 용량 - 데이터 개수: 3,111,024개<br>- 데이터셋 용량: 총 427KB
4 알고리즘 


알고리즘 및 간략 소개

Random Forest, Deep Neural Network 


Random Forest:
다수의 결정 트리(Decision Tree) 기반으로 구성된 앙상블(ensemble) 모델입니다. 다양한 트리의 예측을 결합하여 최종 결과를 도출합니다. 특히, 과적합을 방지하고 예측 성능을 향상시키기 위해 유용하며, 제조공정 데이터의 복잡한 패턴을 효과적으로 분석할 수 있습니다.<br>Deep Neural Network: 여러 개의 인공 신경망 레이어(layer)를 쌓아 올려 데이터를 분석하는 신경망 모델입니다. 각 레이어에서 특성을 추출하고 다음 레이어로 전달하여 최종적으로 예측을 수행합니다. 복잡한 비선형 관계를 학습하고, 고차원 데이터를 다룰 때 유용합니다.
5 분석 결과 및 시사점 제조공정에서의 피크 전력을 낮추기 위해 관련 생산 데이터를 수집하고 분석하여 에너지 사용량을 예측하는 모델을 구축했습니다. 이를 통해 피크 전력 발생을 줄이고 전기료 절감과 생산 공정의 효율화를 기대할 수 있으며, 제조공정 현장에서 에너지 사용 예측에 널리 적용될 수 있을 것입니다.