Compare commits
10 Commits
ee0a998b4b
...
da51f38e3c
Author | SHA1 | Date | |
---|---|---|---|
da51f38e3c | |||
6b71884047 | |||
82b132f519 | |||
7f03ff861b | |||
019a1419d1 | |||
4d1fd7a5be | |||
![]() |
2b0d3ebb6c | ||
![]() |
34bf998113 | ||
![]() |
6ff1eb043e | ||
![]() |
39cf244de9 |
15
Dockerfile
Normal file
15
Dockerfile
Normal file
@ -0,0 +1,15 @@
|
||||
FROM python:3.10-slim-buster
|
||||
|
||||
WORKDIR /usr/src/app
|
||||
|
||||
ENV PYTHONDONTWRITEBYTECODE 1
|
||||
ENV PYTHONUNBUFFERED 1
|
||||
|
||||
COPY . /usr/src/app
|
||||
|
||||
# install python dependencies
|
||||
RUN pip install --upgrade pip
|
||||
RUN pip install --no-cache-dir -r requirements.txt
|
||||
|
||||
# 6. Python main.py 파일을 실행합니다.
|
||||
CMD ["python", "main.py"]
|
30
README.md
30
README.md
@ -1,6 +1,8 @@
|
||||
# wp-post-automation
|
||||
워드프레스 포스팅 자동화 프로젝트.
|
||||
make.com을 이용해서 만든 AutoMation Flow를 Python을 이용하여 변환.
|
||||
2024.10.04 - 테스트 완료. 프로젝트 1차 종료.
|
||||
* 워드프레스 포스팅 자동화 프로젝트.
|
||||
* make.com을 이용해서 만든 AutoMation Flow를 Python을 이용하여 변환.
|
||||
|
||||
## 기존 Flow
|
||||
* MariaDB에 저장된 최신 참고 url정보를 얻어온다.
|
||||
* HTTP모듈을 이용하여 참고 자료를 가져온다.
|
||||
@ -18,12 +20,24 @@ make.com을 이용해서 만든 AutoMation Flow를 Python을 이용하여 변환
|
||||
* kubectl create -f file.yaml을 이용하여 1회성 동작 하도록 구현한다.
|
||||
|
||||
### Python 개발 순서
|
||||
* DB에서 url을 가져오는 코드작성.
|
||||
* url을 이용해서 파싱하고 텍스트만 추출하는 기능 구현.
|
||||
* OpenAI이용 코드 작성.
|
||||
* HTML문서 변환 코드 작성.
|
||||
* 워드프레스 등록 플로우 코드 작성.
|
||||
* 코드 리팩토링.
|
||||
* DB에서 url을 가져오는 코드작성(완료).
|
||||
* url을 이용해서 파싱하고 텍스트만 추출하는 기능 구현(완료).
|
||||
* OpenAI이용 코드 작성(완료)-비용 절감을 위하여 제목, 이미지 생성 제외.
|
||||
* HTML문서 변환 코드 작성(완료).
|
||||
* 워드프레스 등록 플로우 코드 작성(완료).
|
||||
|
||||
### 코드 리팩토링.
|
||||
* 전체 리팩토링(완료).
|
||||
* 모듈화, 패키지화(완료).
|
||||
|
||||
## Docker Image Build
|
||||
2024.10.04 업데이트
|
||||
* Dockerfile 추가(완료).
|
||||
|
||||
## Kubernetes manifests
|
||||
2024.10.04 업데이트
|
||||
* 샘플 템플릿 작성(완료)
|
||||
* 쿠버네티스 환경 테스트(완료).
|
||||
|
||||
## 코드 이슈
|
||||
### 네이버 블로그 크롤링
|
||||
|
45
get_url.py
45
get_url.py
@ -1,45 +0,0 @@
|
||||
import mysql.connector
|
||||
from dotenv import load_dotenv
|
||||
import os
|
||||
|
||||
# .env.demo 파일 로드
|
||||
load_dotenv(r'./.env.dev')
|
||||
# 환경 변수 가져오기
|
||||
host = os.getenv('DB_HOST')
|
||||
user = os.getenv('DB_USER')
|
||||
password = os.getenv('DB_PASSWORD')
|
||||
database = os.getenv('DB_NAME')
|
||||
# MariaDB에 연결하는 함수
|
||||
def fetch_data_from_mariadb():
|
||||
try:
|
||||
# 데이터베이스 연결
|
||||
connection = mysql.connector.connect(
|
||||
host=host,
|
||||
user=user,
|
||||
password=password,
|
||||
database=database
|
||||
)
|
||||
|
||||
# 커서 생성
|
||||
cursor = connection.cursor(dictionary=True)
|
||||
|
||||
# 쿼리 실행
|
||||
query = "SELECT * FROM healty_url_source ORDER BY idx DESC LIMIT 1;"
|
||||
cursor.execute(query)
|
||||
|
||||
# 결과 가져오기
|
||||
result = cursor.fetchone()
|
||||
return result
|
||||
|
||||
except mysql.connector.Error as err:
|
||||
print(f"Error: {err}")
|
||||
finally:
|
||||
if connection.is_connected():
|
||||
cursor.close()
|
||||
connection.close()
|
||||
|
||||
if __name__ == "__main__":
|
||||
# 결과 확인
|
||||
data = fetch_data_from_mariadb()
|
||||
print(data['url'])
|
||||
|
16
k8s-manifests/env.yaml
Normal file
16
k8s-manifests/env.yaml
Normal file
@ -0,0 +1,16 @@
|
||||
apiVersion: v1
|
||||
kind: Secret
|
||||
metadata:
|
||||
name: wp-secret
|
||||
namespace: default
|
||||
type: Opaque
|
||||
data:
|
||||
DB_HOST:
|
||||
DB_USER:
|
||||
DB_PASSWORD:
|
||||
DB_NAME:
|
||||
OPENAI_API_KEY:
|
||||
WP_URL:
|
||||
WP_USER:
|
||||
WP_API_KEY:
|
||||
WP_POST_STYLE: ""
|
61
k8s-manifests/pod.yaml
Normal file
61
k8s-manifests/pod.yaml
Normal file
@ -0,0 +1,61 @@
|
||||
apiVersion: v1
|
||||
kind: Pod
|
||||
metadata:
|
||||
name: wp-auto-pod
|
||||
namespace: default
|
||||
annotations:
|
||||
sidecar.istio.io/inject: "false"
|
||||
spec:
|
||||
containers:
|
||||
- name: wp-auto-container
|
||||
image: harbor.icurfer.com/py_prj/wp-auto:0.0.1
|
||||
imagePullPolicy: IfNotPresent
|
||||
env:
|
||||
- name: DB_HOST
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: DB_HOST
|
||||
- name: DB_USER
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: DB_USER
|
||||
- name: DB_PASSWORD
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: DB_PASSWORD
|
||||
- name: DB_NAME
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: DB_NAME
|
||||
- name: OPENAI_API_KEY
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: OPENAI_API_KEY
|
||||
- name: WP_URL
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: WP_URL
|
||||
- name: WP_USER
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: WP_USER
|
||||
- name: WP_API_KEY
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: WP_API_KEY
|
||||
- name: WP_POST_STYLE
|
||||
valueFrom:
|
||||
secretKeyRef:
|
||||
name: wp-secret
|
||||
key: WP_POST_STYLE
|
||||
restartPolicy: Never
|
||||
imagePullSecrets:
|
||||
- name: harbor-icurfer-private
|
43
main.py
Normal file
43
main.py
Normal file
@ -0,0 +1,43 @@
|
||||
import package as pkg
|
||||
from package import GetConfig, MariaDB, ChangeTextToPost, WordPress
|
||||
import markdown
|
||||
|
||||
# 2024-10-03 환경 변수 호출
|
||||
print('### Get values From .env')
|
||||
config = GetConfig()
|
||||
dict_data = config.get_config_as_dict()
|
||||
|
||||
# 2024-10-03 db에서 url정보 호출
|
||||
print('### Get URL From DB')
|
||||
db = MariaDB(dict_data)
|
||||
url = db.fetch_data_from_mariadb()['url']
|
||||
|
||||
# 2024-10-03 url을 이용해서 text추출
|
||||
print('### Get content From URL')
|
||||
origin_content = pkg.getContents(url)
|
||||
|
||||
# 2024-10-03 openAI를 이용하여 게시글 스타일 변경
|
||||
print('### Convert to Post - openAI')
|
||||
openai_key = dict_data['openai_api_key']
|
||||
wp_reference_style = dict_data['wp_post_style']
|
||||
|
||||
open_ai = ChangeTextToPost(openai_key)
|
||||
post_article = open_ai.generate_blog_post(origin_content, wp_reference_style)
|
||||
|
||||
print('### Convert to HTML - markdown to html')
|
||||
# 2024-10-03 Markdown을 HTML로 변환
|
||||
html = markdown.markdown(post_article)
|
||||
|
||||
# 2024-10-03 워드프레스 포스팅 임시등록
|
||||
print('### Create post')
|
||||
wp = WordPress(dict_data)
|
||||
rs = wp.create_post(2,html)
|
||||
|
||||
if __name__ == "__main__":
|
||||
# print(post_article)
|
||||
print("추가 확인을 위한 출력")
|
||||
if rs.ok:
|
||||
print(f"### 성공 code:{rs.status_code}")
|
||||
else:
|
||||
print(f"### 실패 code:{rs.status_code} reason:{rs.reason} msg:{rs.text}")
|
||||
|
50
open_ai.py
50
open_ai.py
@ -1,50 +0,0 @@
|
||||
import os
|
||||
from openai import OpenAI
|
||||
from dotenv import load_dotenv
|
||||
import translate_article as ta
|
||||
|
||||
# .env 파일에서 API 키 로드
|
||||
load_dotenv()
|
||||
client = OpenAI(
|
||||
api_key=os.getenv("OPENAI_API_KEY"),
|
||||
)
|
||||
|
||||
def generate_blog_post(article_text, style_reference):
|
||||
|
||||
# ChatCompletion API를 사용하여 텍스트 변환
|
||||
prompt = (
|
||||
"""
|
||||
너는 대한민국에 거주하는 블로그 전문가이다.
|
||||
네가 작성한 블로그 글은 지난 3년간 높은 주목성, 관여도, 전환율을 만들었다.
|
||||
이 전문성을 이용해서 제공받는 기사를 블로그 형태로 변형하여 작성해야만 한다.
|
||||
"""
|
||||
f"\n블로그 스타일은 아래 문서를 모방해줘. 적절한 사례들이 들어가도 좋겠어.\n---\n{style_reference}\n"
|
||||
f"제공된 기사 내용:\n{article_text}"
|
||||
)
|
||||
|
||||
response = client.chat.completions.create(
|
||||
model="gpt-4o",
|
||||
messages=[
|
||||
{"role": "system", "content": "너는 대한민국에 거주하는 블로그 전문가이다."},
|
||||
{"role": "user", "content": prompt}
|
||||
],
|
||||
max_tokens=2000,
|
||||
temperature=0.7, # 창의성을 위한 적절한 값 조정
|
||||
)
|
||||
|
||||
# 응답에서 텍스트 추출
|
||||
blog_post = response.choices[0].message.content
|
||||
return blog_post
|
||||
|
||||
# 예시 기사 텍스트 (text 파싱 결과로 제공된 텍스트를 사용할 수 있습니다)
|
||||
article_text = ta.getContents()
|
||||
|
||||
# 블로그 스타일 참고 텍스트
|
||||
style_reference = os.getenv("reference_style")
|
||||
|
||||
# 블로그 포스트 생성
|
||||
blog_post = generate_blog_post(article_text, style_reference)
|
||||
|
||||
# 결과 출력
|
||||
print(">>>>\n" * 3)
|
||||
print(blog_post)
|
46
package/GetConfig.py
Normal file
46
package/GetConfig.py
Normal file
@ -0,0 +1,46 @@
|
||||
import os
|
||||
from dotenv import load_dotenv
|
||||
|
||||
# 우선순위: .env.prd > .env.dev > .env
|
||||
if os.path.exists('.env.prd'):
|
||||
load_dotenv('.env.prd')
|
||||
elif os.path.exists('.env.dev'):
|
||||
load_dotenv('.env.dev')
|
||||
else:
|
||||
load_dotenv('.env') # 기본 .env 파일
|
||||
|
||||
class GetConfig:
|
||||
def __init__(self):
|
||||
self.db_host = os.getenv('DB_HOST')
|
||||
self.db_user = os.getenv('DB_USER')
|
||||
self.db_pw = os.getenv('DB_PASSWORD')
|
||||
self.db_database = os.getenv('DB_NAME')
|
||||
self.openai_api_key = os.getenv('OPENAI_API_KEY')
|
||||
self.wp_url = os.getenv('WP_URL')
|
||||
self.wp_user = os.getenv('WP_USER')
|
||||
self.wp_api_key = os.getenv('WP_API_KEY')
|
||||
self.wp_post_style = os.getenv('WP_POST_STYLE')
|
||||
|
||||
def show_config(self):
|
||||
for key, value in self.__dict__.items():
|
||||
print(f"{key.upper()}: {value}")
|
||||
|
||||
def get_config_as_dict(self):
|
||||
# 인스턴스 속성을 딕셔너리로 반환
|
||||
return self.__dict__
|
||||
|
||||
|
||||
if __name__ == "__main__":
|
||||
# 결과 확인
|
||||
config = GetConfig()
|
||||
config.show_config()
|
||||
|
||||
|
||||
# 오랜만에 보다보니 헷갈려서 참고용으로 작성
|
||||
# class GetConfig:
|
||||
# def __init__(self, name=None):
|
||||
# self.name = name if name is not None else "default_name"
|
||||
# self.host = os.getenv('DB_HOST')
|
||||
# self.user = os.getenv('DB_USER')
|
||||
# self.password = os.getenv('DB_PASSWORD')
|
||||
# self.database = os.getenv('DB_NAME')
|
56
package/MariaDB.py
Normal file
56
package/MariaDB.py
Normal file
@ -0,0 +1,56 @@
|
||||
import mysql.connector
|
||||
|
||||
class MariaDB:
|
||||
|
||||
def __init__(self, dict):
|
||||
self.db_host = dict['db_host']
|
||||
self.db_user = dict['db_user']
|
||||
self.db_pw = dict['db_pw']
|
||||
self.db_database = dict['db_database']
|
||||
|
||||
def show_config(self):
|
||||
for key, value in self.__dict__.items():
|
||||
print(f"{key.upper()}: {value}")
|
||||
|
||||
def fetch_data_from_mariadb(self):
|
||||
try:
|
||||
# 데이터베이스 연결
|
||||
connection = mysql.connector.connect(
|
||||
host=self.db_host,
|
||||
user=self.db_user,
|
||||
password=self.db_pw,
|
||||
database=self.db_database
|
||||
)
|
||||
|
||||
# 커서 생성
|
||||
cursor = connection.cursor(dictionary=True)
|
||||
|
||||
# 쿼리 실행
|
||||
query = "SELECT * FROM healty_url_source ORDER BY idx DESC LIMIT 1;"
|
||||
cursor.execute(query)
|
||||
|
||||
# 결과 가져오기
|
||||
result = cursor.fetchone()
|
||||
return result
|
||||
|
||||
except mysql.connector.Error as err:
|
||||
print(f"Error: {err}")
|
||||
finally:
|
||||
if connection.is_connected():
|
||||
cursor.close()
|
||||
connection.close()
|
||||
|
||||
if __name__ == "__main__":
|
||||
|
||||
import GetConfig
|
||||
|
||||
config = GetConfig.GetConfig()
|
||||
# config 잘 가져오는지 확인
|
||||
config_dict = config.get_config_as_dict()
|
||||
|
||||
# MariaDB 테스트
|
||||
dbg = MariaDB(config_dict)
|
||||
# dbg.show_config()
|
||||
url = dbg.fetch_data_from_mariadb()
|
||||
print(url['url'])
|
||||
|
37
package/OpenAI.py
Normal file
37
package/OpenAI.py
Normal file
@ -0,0 +1,37 @@
|
||||
from openai import OpenAI
|
||||
|
||||
class ChangeTextToPost:
|
||||
|
||||
def __init__(self, key):
|
||||
self.client = OpenAI(
|
||||
api_key=key,
|
||||
)
|
||||
|
||||
def generate_blog_post(self, origin_content, wp_post_style):
|
||||
|
||||
# ChatCompletion API를 사용하여 텍스트 변환
|
||||
prompt = (
|
||||
"""
|
||||
너는 대한민국에 거주하는 블로그 전문가이다.
|
||||
네가 작성한 블로그 글은 지난 3년간 높은 주목성, 관여도, 전환율을 만들었다.
|
||||
이 전문성을 이용해서 제공받는 기사를 블로그 형태로 변형하여 작성해야만 한다.
|
||||
---
|
||||
글을 작성하고 제목을 만들어서 맨 마지막 줄에 추가해줘.
|
||||
"""
|
||||
f"\n블로그 스타일은 아래 문서를 모방해줘. markdown형태로 작성되어야한다. 적절한 사례들이 들어가도 좋겠어.\n---\n{wp_post_style}\n"
|
||||
f"제공된 기사 내용:\n{origin_content}"
|
||||
)
|
||||
|
||||
response = self.client.chat.completions.create(
|
||||
model="gpt-4o",
|
||||
messages=[
|
||||
{"role": "system", "content": "너는 대한민국에 거주하는 블로그 전문가이다."},
|
||||
{"role": "user", "content": prompt}
|
||||
],
|
||||
max_tokens=2000,
|
||||
temperature=0.7, # 창의성을 위한 적절한 값 조정
|
||||
)
|
||||
|
||||
# 응답에서 텍스트 추출
|
||||
blog_post = response.choices[0].message.content
|
||||
return blog_post
|
61
package/Utility.py
Normal file
61
package/Utility.py
Normal file
@ -0,0 +1,61 @@
|
||||
import requests, json
|
||||
from urllib.parse import urljoin
|
||||
from bs4 import BeautifulSoup
|
||||
from datetime import datetime
|
||||
|
||||
def getContents(url):
|
||||
# HTTP GET 요청으로 페이지 가져오기
|
||||
response = requests.get(url)
|
||||
|
||||
# 응답 상태 확인
|
||||
if response.status_code == 200:
|
||||
# HTML 파싱
|
||||
soup = BeautifulSoup(response.text, 'html.parser')
|
||||
|
||||
# HTML 태그를 제거 후 페이지의 모든 텍스트 가져오기 (전체 내용)
|
||||
page_content = soup.get_text()
|
||||
|
||||
# 빈 줄을 제거하고 텍스트만 출력 (줄바꿈 문자를 기준으로 필터링)
|
||||
lines = [line.strip() for line in page_content.splitlines() if line.strip()]
|
||||
|
||||
# 결과 출력
|
||||
contents = "\n".join(lines)
|
||||
return contents
|
||||
else:
|
||||
print(f"Failed to fetch the URL. Status code: {response.status_code}")
|
||||
|
||||
class WordPress():
|
||||
|
||||
def __init__(self, dict):
|
||||
self.wp_url = dict['wp_url']
|
||||
self.wp_user = dict['wp_user']
|
||||
self.wp_user = dict['wp_user']
|
||||
self.wp_api_key = dict['wp_api_key']
|
||||
|
||||
def create_post(self, category_id, content, media_id = None, status = "draft", title="파이썬 자동 포스팅"):
|
||||
payload = {
|
||||
"status": status, # publish / draft
|
||||
"title": title,
|
||||
"content": content,
|
||||
"date": datetime.now().isoformat(), # YYYY-MM-DDTHH:MM:SS
|
||||
"categories": category_id
|
||||
}
|
||||
if media_id is not None:
|
||||
payload['featured_media'] = media_id
|
||||
|
||||
|
||||
|
||||
return requests.post(urljoin(self.wp_url, "wp-json/wp/v2/posts"),
|
||||
data=json.dumps(payload),
|
||||
headers={'Content-type': "application/json"},
|
||||
auth=(self.wp_user, self.wp_api_key))
|
||||
# if result.ok:
|
||||
# print(f"성공 code:{result.status_code}")
|
||||
# else:
|
||||
# print(f"실패 code:{result.status_code} reason:{result.reason} msg:{result.text}")
|
||||
|
||||
if __name__ == "__main__":
|
||||
# url = 'example_url'
|
||||
# tmp = getContents(url)
|
||||
# print(tmp)
|
||||
pass
|
5
package/__init__.py
Normal file
5
package/__init__.py
Normal file
@ -0,0 +1,5 @@
|
||||
from .Utility import getContents
|
||||
from .Utility import WordPress
|
||||
from .GetConfig import GetConfig
|
||||
from .MariaDB import MariaDB
|
||||
from .OpenAI import ChangeTextToPost
|
BIN
requirements.txt
BIN
requirements.txt
Binary file not shown.
9
sample.env.dev
Normal file
9
sample.env.dev
Normal file
@ -0,0 +1,9 @@
|
||||
DB_HOST=192.168.0.1
|
||||
DB_USER=demo
|
||||
DB_PASSWORD=demo
|
||||
DB_NAME=demo
|
||||
OPENAI_API_KEY=demo
|
||||
WP_URL='https://www.example.com'
|
||||
WP_USER='demo'
|
||||
WP_API_KEY='demo'
|
||||
WP_POST_STYLE="문장"
|
@ -1,30 +0,0 @@
|
||||
import requests
|
||||
from bs4 import BeautifulSoup
|
||||
import get_url
|
||||
|
||||
|
||||
url = get_url.fetch_data_from_mariadb()['url']
|
||||
|
||||
def getContents():
|
||||
# HTTP GET 요청으로 페이지 가져오기
|
||||
response = requests.get(url)
|
||||
|
||||
# 응답 상태 확인
|
||||
if response.status_code == 200:
|
||||
# HTML 파싱
|
||||
soup = BeautifulSoup(response.text, 'html.parser')
|
||||
|
||||
# HTML 태그를 제거 후 페이지의 모든 텍스트 가져오기 (전체 내용)
|
||||
page_content = soup.get_text()
|
||||
|
||||
# 빈 줄을 제거하고 텍스트만 출력 (줄바꿈 문자를 기준으로 필터링)
|
||||
lines = [line.strip() for line in page_content.splitlines() if line.strip()]
|
||||
|
||||
# 결과 출력
|
||||
contents = "\n".join(lines)
|
||||
return contents
|
||||
else:
|
||||
print(f"Failed to fetch the URL. Status code: {response.status_code}")
|
||||
|
||||
tmp = getContents()
|
||||
print(tmp)
|
Loading…
Reference in New Issue
Block a user