본문 바로가기
Uipath/Uipath mini Program

[Uipath] 알리딘에서 조건에 맞는 책 찾기 - 데이터스크랩

by 두리두리안 2021. 7. 26.

Excel Application Scope

 

Excel을 읽어오기 위해 생성 하며 Excel이라는 변수에는 Excel의 경로가 들어 있다.

Excel의 경로를 하드 코딩하는것은 나중에 유지보수를 할떄 적절하지 않기에 변수로 처리 했다.

Read Range를 통하여 읽어온 Excel에서 "Topic"이라는 Shell을 읽어 온다. 사실상 이부분이 발표떄

他の人と一番違う物でした。이 부분이 없으면 쓸대 없는 하드 코딩이 너무 늘어 난다.

 

For Each Row in Data Table

위에서 가져온 Shell의 정보를 가지고 와서 반복을 시켜주는 부분이다.

"Topic"이라는 Shell에서 Topic이라는 내용이 가지고 있는 정보를 가지고 오겠다는 부분이다.

 

Open Brower

 

엑셀과 마찬가지로 경로를 나중에 유지보수를 위하여 변수에 저장 하였다.

웹페이지를 읽어오고 Delay를 하였는데 그 이유는 밑에 사진에서 유추 할 수 있다.

알라딘 같은 경우 기본적으로 InputBox에 Text가 들어 있다. 처음 엑셀을 읽고 작업에 들어가는 경우에는 문제가 없지만 2번쨰 요소를 찾을시 Null값이 검색되는 경우가 발생 하여 Delay를 넣어서 2초

뒤에 작업 진행 되도록 작성 하였다.

Type Into에서 inputBox영역에 엑셀에서 읽어온 것을 검색하도록 하였으며 Send Hostkey를 통해 검색을 진행 하였다.

 

조건 검색

이 부분은 별로 한것이 없다. 그냥 클릭으로 해결 하였다.

 

데이터 스크래핑

자세히 보면 일반적 데이터 스크래핑과 조금 다른것을 알 수 있다.

이게 데이터스크랩핑을 진행한 결과이다. 나는 여기에서 필요한 [Extract] 부분만 추출했다.

스크래핑을 진행 하다보니 테이블로 잡혀서 처음에는 고민이 많았지만

밑에 사진과 같이 진행하여 내가 원하는 정보만 추출 할수 있었다.

 

이름은 이름 끼리, 출판사는 출판사 끼리, 가격은 가격끼리 추출 선택 하였다.

 

Column1이 끝나면 완료를 누르는것이 아니라 상호 연결된 데이터 추출을 선택 하여 나머지 데이터들도

스크래핑을 진행 하였다.

 

Excel에 저장

마지막으로 엑셀에 저장하기 위해서 다시 한번 엑셀을 불러 온다.

저장할떄 그냥 엑셀에 저장한것이 아니라 오늘 날짜에 맞게 저장을 진행 하였다.

Now.ToString("yyMMdd") 이런씩으로 하면 오늘 날짜에 맞게 저장이 된다

 

"C:\Users\1020a\OneDrive\바탕 화면\알라딘\"+Now.ToString("yyMMdd")+"일_책검색.xlsx"

각 셀을 읽어온 이름으로 저장하고 그에 맞는 정보를 저장 한다

Set Range Color는 원하는 부분에 색을 입혀주는 것이다. 크게 중요치 않다.

작업이 마무리되면 Clear Date Table을 사용하여 데이터 스크래핑을 한 데이터 테이블 값을 지워 주었다.

안그럼 값은 값만 엑셀에 저장 된다.

알리딘에서 조건에 맞는 책 찾기.zip
2.14MB
210726일_책검색.xlsx
0.01MB
Book.xlsx
0.01MB

'Uipath > Uipath mini Program' 카테고리의 다른 글

UIPATH 구구단 (특정 단 빼기)  (0) 2022.01.05
Uipath 구구단  (0) 2021.08.01