apriori 2

[ Python ] 장바구니 알고리즘 ( apriori ) 구현해보기 #2

어제 한 내용을 이어서 하자면, 데이터프레임으로 변경을 완료했는데 이 데이터프레임의 내용은 대략적으로 글로 쓰자면 1번째 행은 : JAVA, JSP 2번쨰 행은 : CSS, JAVA, JSP 을 표로 표시한 내용이다. 이제 aprior 알고리즘을 사용해서 어떻게 나오는지 보자 1 2 3 itemset = apriori(df, min_support=0.1, use_colnames=True) itemset print(itemset,'\n') Colored by Color Scripter cs 소스를 돌려보면.. 아래와 같이 값이 나오는데 support에 해당하는 값은 어떻게 나온걸까.. 짱구를 굴려봐도 답이 안나온다.. 이럴땐 구글링! 간단한 샘플을 통한 통계척도 구해보기 역시 구글! 없는게 없다 😄 맞는지..

IT Diary/# Python 2021.07.08

[ Python ] 장바구니 알고리즘 ( apriori ) 구현해보기 #1

연관분석의 대표적인 알고리즘 중 하나인 Apriori를 사용해서 연관분석을 진행해보려고 한다. 장바구니 분석 장바구니 분석은 보통 몇 가지 모델링 기법으로 이루어진다. 판매자들과 전자상거래 사이트에서 일반적으로 사용하는 장바구니 분석과 거래 분석을 통해 소비자들이 가장 많이 사는 제품에 대한 정보와 특정 제품이 가장 많이 팔리는 시기에 대한 정보를 알아내려고 한다. 데이터 기반 의사결정 만들기 장바구니 분석의 결과는 자주 같이 구매되는 아이템 혹은 물건들의 집합이다. 이제 연관도를 향상시키는 강한 지지도, 신뢰도, 향상도로 인해 이런 일들이 가능하고, 소비자들은 그것들을 구매하려 할것이며, 또한 판매자들은 가게나 그들의 웹사이트에 관련 있는 제품들을 같이 진열해 놓을 것이다. 하지만 강한 연관성은 항상 ..

IT Diary/# Python 2021.07.08