본문 바로가기

프로그래밍

해커톤 (2) - 컨텐츠 구상 (openai api사용)

결국 모델링은 포기를 하고 다시 알고리즘으로 돌아오게 되었다.

 

근데 알고리즘은 전 글에서도 얘기했듯이 애초에 기준을 마련하기도 어렵고,

기준을 마련한다 하더라도 신뢰성 검증 역시 더 큰 문제이기에 

주제를 새로 정해야 하는 얘기까지 나왔었다

 

평소에 일상적인 문제가 생겨도 GPT한테 하소연 하듯이 얘기 했는데

이 때도 GPT에게 하소연을 했던 것 같다.

 

 

그러다 문득 Gpt를 이용해서 문제에 접근하면 어떨까 하는 생각이 들었다.

 

 

기사의 내용을 가져와 GPT에게 신뢰성을 검증해달라는 식으로 문제에 접근할 수 있지 않을까..

물론

신뢰성 자체를 GPT에게 요청한다고 해도 호의적인 대답을 듣지는 못했다!

이에 관련한 얘기를 팀원들과 공유했고 

 

 

결론은

 

 

신뢰성을 직접 요청하지말고

사실과 의견의 구분을 요청하고 이에 대한 대답을 사용자들에게 제공하자

 

 


 

최선이었다.

 

일단 해당 방법으로 문제에 접근하고

Openai api 를 사용해보고 싶은 참이기도 해서 그대로 진행하기로 했다.

(일단 주어진 시간이 많지 않아서 ㅠㅠ)

 

 

그리고 콘텐츠가 좀 부족하다는 생각도 들어서 사용자들에게 

 

 

해당 영상이 신뢰할만한
출처를 포함하고 있나요?

해당 영상에서 사실과 개인의
의견을 분리하고 있나요?

 

 

와 같은 응답을 받아 그 결과도 사용자들에게 노출시키기로 했다.

 

 


 

위에서 말한 방식으로 문제를 해결하기 위해서는

 

 

 

 

1. openai api를 사용하여 우리 플러그인에서 응답을 받아야함.

2. 유튜브 자막을 스크랩 해서 가져와야함

 

 

정도의 문제가 있었다.

 

 

일단 첫번쨰 문제는 openai api 를 잘만 가져와서 사용만 하면 되는 것이었다.

 

 

 

 

 


 

 

 

openai api

 

openai api를 활용하는 방법은 이미 많은 코드들이 있어서 

openai 개인키만 발급받아서 그대로 넣고

코드 그대로 가져오기만 하면 잘 작동이 됐다.

 

 

 

요금이 좀 들긴하지만 테스트 단게에서 부담이 될 정도는 아니니까,,

나중에 서비스 되고 나서는 다른 문제라고 생각했다.

 

 

 

근데 여기서 문제가 하나 발생했다!

 

 

유튜브 자막의 특성상 대부분 구어체로 작성이 되어있는 콘텐츠는

사실과 의견의 구분을 제대로 수행해주지 못하더라..

 

 

 

ㅋㅋㅋ이 문제를 해결하려고 기술적으로도 접근하고 구어체적인 컨텐츠는 제외를 시켜야 하나 많이 고민했지만

복잡할수록 단순하게 생각하기로 했다.

 

그냥 

구어체가 대부분인 컨텐츠는

 

 

"해당 글을 기사의 형태로 바꿔줘"(뻔뻔)

 

라는 요청을 보내어 기사의 형태로 바꿔버리는것..

 

 

이렇게 해도 되나,,?? 

근데 이게 결과는 너무 잘 나오니까..

그래.! 이게 생성형 AI를 잘 다루는 방법이지 생각하며 ㅋㅋㅋ(너무 억지인듯한)

 

유튜브 자막만 스크래핑 해보면 백엔의 기술적 문제는 모두 해결되는 것이라 생각했다.