1강 데이터 분석과 컴퓨터

학습 개요

  1. 지식기반 정보사회에서 우리는 많은 정보를 접하게 되는데, 특히 그 중 많은 것이 데이터를 통한 정보이다. 우리가 살고 있는 현실을 포착하고 이해하는 과정의 대부분은 데이터를 통해 이루어집니다. 데이터 분석을 위해서는 기본적인 데이터 분석 개념과 방법이 필요하며, 데이터 분석 소프트웨어의 사용은 필수적입니다. 이 장에서는 데이터 분석의 기본 개념을 소개하고 데이터 분석 소프트웨어를 소개합니다. 또한 엑셀과 R을 활용한 데이터 분석 사례를 제시한다.

학습 목표

  1. 지식기반 정보사회에서의 컴퓨터 활용을 이해할 수 있다.
  2. 데이터 분석 프로세스를 설명합니다.
  3. 데이터 분석 소프트웨어를 설명할 수 있습니다.
  4. 엑셀과 R을 활용한 데이터 분석의 예를 설명할 수 있다.

본문

통계와 데이터 처리가 어렵다는 인상을 받았지만, 이 책은 이 강의를 통해 데이터 측면에서 방향을 알아가는 것을 목표로 한다.

이 책의 내용은 세 부분으로 나누어져 있는데,

1부에서는 정보와 컴퓨터를 이용한 데이터 분석과 데이터 입력을 위한 기본 소프트웨어를 소개한다.

기본에 대해 이야기하다

2부에서는 Excel을 사용하여 간단한 데이터 분석을 수행하는 방법을 소개합니다.

3부에서는 데이터 분석에 중요한 R과 데이터 사이언스에 유용한 Python에 대한 입문 내용을 다룬다.

파트 1의 내용

1. 데이터 정보 및 컴퓨터

2. 데이터 분석 개요

3. 데이터 분석 소프트웨어 도입

4. 데이터 분석 예시

1. 데이터 정보 및 컴퓨터

데이터 정보의 관점에서 데이터를 다루기 위해서는 컴퓨터가 없어서는 안 되며, 이러한 내용에 대해 간단히 살펴보도록 하겠습니다.

오늘날 사회는 정보화 사회이며 빅데이터, 딥러닝, 인공지능 시대입니다.

AI는 데이터를 수집하고 잘 활용하는 데 중요한 역할을 합니다.

정보사회는 정보사회다. 정보화 사회에서는 정보의 수집,

수집된 정보의 가치를 평가하고 정보를 활용하는 능력은 기본이며 지식기반 정보사회라고 합니다.

데이터를 효율적으로 처리하고 분석하기 위해서는 컴퓨터 활용 및 데이터 분석 능력이 필수적입니다.

데이터 분석 능력을 키울수록 데이터를 잘 다루고 필요한 정보를 수집할 수 있어야 하기 때문에 통계 지식이 중요합니다.

그래서 우리는 통계 데이터 과학의 관점으로 나아가고 있습니다.

지식정보화 사회에서 알아야 할 것

1. 컴퓨터 기술이 있어야 합니다.

2. 인터넷을 효율적으로 사용할 수 있어야 합니다.

3. 정보를 제대로 이해하고 문제를 파악하고 판단하기 위해서는 통계적 사고가 필요합니다.

4. 기본 데이터 분석 개념 및 방법에 익숙합니다.

5. 데이터 분석 소프트웨어를 잘 활용하여 데이터에서 유용한 정보를 추출하고 합리적인 결정을 내립니다.

2. 데이터 분석 개요

데이터 분석 절차

문제 정의 => 조사, 테스트 계획 => 데이터 수집 => 데이터 정리, 분석 => 분석 결과 평가

문제 정의: 데이터로 연구를 하기 위해서는 문제를 정의해야 합니다.

예시) 정책이 있고 그 정책을 조사하고 싶다면 조사 대상이 무엇인지, 조사 대상에 어떤 방법이 있을 것인지를 고민해야 합니다.

예2) 유리의 강도를 어떤 온도와 습도에서 시험해야 한다면 어떻게 실험을 잘 해야 할까요?

연구 방법이 결정되면 실험 설계를 수립해야 합니다.

데이터 수집: 연구 방법을 통해 데이터를 수집합니다.

이를 효율적으로 수행할 수 있는 방법을 제공하며, 예를 들어 통계 연구 방법론과 샘플링 연구 이론은 연구 방법에 대한 방법을 제공합니다.

실험 설계와 관련하여 제공되는 방법은 실험 설계 및 응용과 같은 주제에서 실험 설계를 효율적이고 객관적으로 수행하는 방법입니다.

주제를 염두에두고 연구하고 연구해야합니다.

데이터 구성 및 분석: 데이터를 잘 수집했다면 지식을 종합적으로 구성하고 분석할 수 있는 방법이 필요합니다.

통계 입문, 회귀 모델링 및 다변량 분석과 같은 여러 주제가 제공됩니다. 그래서 이러한 문제들을 지속력으로 정리하면 전체적인 효율성을 높일 수 있습니다.

기술을 더욱 발전시키고 분석할 수 있습니다.

3. 데이터 분석 소프트웨어 도입

-뛰어나다

-SPSS, SAS 통계를 이용한 데이터 분석 분야에서 널리 사용되는 소프트웨어입니다.

-아르 자형

-파이썬

3학년이 되면 파이썬과 R을 배우고 4학년이 되면 다변량 분석을 배운다.

R 및 Python을 사용한 다변량 분석에서 자세히 다룹니다.

1. SPSS

이러한 시스템은 대화 상자와 Excel의 스프레드시트 형식으로 구성됩니다.

물론 파일을 가져와서 작업할 수 있습니다.

변수 보기를 클릭하여 변수를 정의하면 각 변수가 연속형인지 불연속형인지 쉽게 확인할 수 있습니다.

분석 -> 기술 통계 -> 기술 통계로 이동하여 분석을 확인할 수 있습니다.

대화 상자에서 분류하려는 변수를 선택하고 분석을 위해 선택한 해당 변수에 대해 원하는 통계를 선택합니다.

2. SAS

그것은 뛰어난 데이터 처리 능력을 가지고 있습니다.

탁월한 데이터베이스 및 데이터 웨어하우징 기능

다양한 통계 분석 방법

3번째 줄

프로그래밍 방식으로 완료

그것은 데이터 처리, 분석 및 그래픽에 뛰어난 기능을 가지고 있습니다.