Yujin Kim

ORCID: 0000-0003-4261-1793
Publications
Citations
Views
---
Saved
---
About
Contact & Profiles
Research Areas
  • Topic Modeling
  • Natural Language Processing Techniques
  • Technology and Data Analysis
  • Innovation Policy and R&D
  • Speech Recognition and Synthesis
  • IoT and Edge/Fog Computing
  • Innovation in Digital Healthcare Systems
  • Computational Drug Discovery Methods
  • Pharmaceutical Economics and Policy
  • Advanced Data Compression Techniques
  • Speech and Audio Processing
  • Spam and Phishing Detection
  • Multimodal Machine Learning Applications
  • AI in Service Interactions
  • Impact of AI and Big Data on Business and Society
  • Hate Speech and Cyberbullying Detection
  • Visual Attention and Saliency Detection
  • Healthcare Technology and Patient Monitoring
  • Recommender Systems and Techniques
  • Educational Systems and Policies
  • Firm Innovation and Growth
  • Surface Modification and Superhydrophobicity
  • Microwave Dielectric Ceramics Synthesis
  • Robotics and Automated Systems
  • Computational and Text Analysis Methods

Inha University
2002-2023

Kangwon National University
2019

Gachon University
2018

ShanghaiTech University
2018

Transforming unstructured text into structured and meaningful forms, organized by useful category labels, is a fundamental step in mining for downstream analysis application. However, most existing methods producing label taxonomies building text-based classifiers still rely heavily on domain expertise manual curation, making the process expensive time-consuming. This particularly challenging when space under-specified large-scale data annotations are unavailable. In this paper, we address...

10.48550/arxiv.2403.12173 preprint EN arXiv (Cornell University) 2024-03-18

자연어 처리에서 벤치마크 데이터셋은 거대 언어 모델의 평가에 중요한 역할을 한다. 그러나 비용과 자원의 제한으로 인해 대부분의 처리 벤치마크는 주로 영어와 중국어로 개발되어 왔다. 이 연구에서는 한국어 능력 평가를 위해 다양한 도메인을 포괄하는 데이터셋을 구축하고, 이를 바탕으로 6개의 및 다국어 모델(LLM)의 성능을 평가하였다. 여섯 가지 평가 도메인과 일곱 지표를 사용하여 종합적인 능력을 분석하였다. 과정은 정량적 평가와 더불어 명의 평가자가 수행한 인간 포함하며, GPT-4를 활용한 자동 방법을 적용하여 평가와의 상관관계를 검토하였다. 연구 결과는 제한된 자원으로도 방식을 통해 LLM의 종합적으로 진단할 수 있음을 보여주었고, 평가의 자동화 가능성을 검증하였다. 연구에서 제안한 벤치마크가 사례로 활용되기를 기대한다.

10.22557/hg.2024.9.85.3.679 article KO HAN-GEUL 2024-09-30

Research related to the carbon-emission credit-price prediction model has only considered effects of specific indicators, such as coal and oil prices, long-term studies have been conducted. Recently, carbon emission credits recognized investment assets, stocks real estate. Accordingly, a credit method is needed establish an industrial strategy with low risk. In this study, attempt was made behavior market participants in time series by analyzing correlation between search query volume data...

10.3390/su14138177 article EN Sustainability 2022-07-04

While implementing a construction project, production-rate assessment needs to be conducted throughout the different stages of project because this can determine success or failure project. In South Korea, construction-standard-production-rate (CSPR) is used for determining individual equipment. However, CSPR cannot provide activities considering combination more than two types equipment (eg, excavator and dump truck excavation-load-haul activities). Having ready-made data on such...

10.1080/13467581.2023.2278885 article EN cc-by-nc Journal of Asian Architecture and Building Engineering 2023-12-04

Large Language Models (LLMs) hold the potential to perform a variety of text processing tasks and provide textual explanations for proposed actions or decisions. In era hybrid work, LLMs can intelligent decision support workers who are designing their work plans. particular, they offer suggestions balancing numerous factors, thereby enhancing experience. this paper, we present model workspaces in environments, leveraging reasoning skill LLMs. We first examine LLM's capability making suitable...

10.48550/arxiv.2402.03616 preprint EN arXiv (Cornell University) 2024-02-05

While learning to align Large Language Models (LLMs) with human preferences has shown remarkable success, aligning these models meet the diverse user presents further challenges in preserving previous knowledge. This paper examines impact of personalized preference optimization on LLMs, revealing that extent knowledge loss varies significantly heterogeneity. Although approaches have utilized KL constraint between reference model and policy model, we observe they fail maintain general...

10.48550/arxiv.2407.00693 preprint EN arXiv (Cornell University) 2024-06-30

Utterance verification is used in variable vocabulary word recognition to reject the that does not belong in-vocabulary or correctly recognized word. very important design a user-friendly speech system. We propose new utterance algorithm that, with no-training required, based on minimum error. First, using PBW (Phonetically Balanced Words) DB (445 words), we generate antiphoneme models. Then, for OOV (Out-Of-Vocabulary) rejection, confidence measure which uses likelihood between phoneme...

10.1109/iscas.2000.857361 article EN 2002-11-07

[연구목적] 본 연구의 목적은 최초 신용등급 평가가 기업의 원가조정을 통한 이익조정 유인에 미치는 영향을 살펴보는 것이다. 신용등급의 안정성을 중시하는 신용평가회사가 등급을 지속적으로 조정하지 않기 때문에 신용등급은 자본시장에서 중요한 정보로 고려되며, 특히 이는 향후 등급 재평가 시 벤치마크가 된다. 이에 신용평가회사로부터 처음으로 평가를 받게 된 기업이 우호적인 획득을 위해 이익조정을 하는지 실증 검증한다.<BR>[연구방법] 비대칭적 원가행태의 틀을 활용하여 2002년부터 2019년까지 국내 상장(KOSPI+KOSDAQ) 제조기업에 대해 평가 시점을 기준으로 ±2 회계기간 동안의 원가 행태의 변화를 분석한다.<BR>[연구결과] 판매관리비의 하방경직성이 전후(± 2 회계기간) 기간 대비 완화된 것으로 나타났다. 따라서 기업은 신용등급을 평가받을 때 받기 이익의 상향보고 목적 하에 재량적 원가인 판매관리비를 조절한다고 할 수 있다.<BR>[연구의 시사점] 연구는 유인이...

10.31507/kjmar.2021.8.21.2.23 article KO KOREAN JOURNAL OF MANAGEMENT ACCOUNTING RESEARCH 2021-08-31

[연구목적] 본 연구는 신용평가회사가 공시하는 실제 신용등급과 모형을 통해 도출된 예상 신용등급 간의 차이가 기업의 이익조정 유인에 미치는 영향에 대해 살펴본다. 신용등급이 신용등급보다 낮은 또는 높은 기업이 원가조정을 통한 이익조정을 시도하는지, 그리고 등급 존재하는 원가조정이 차기 신용등급에 영향을 미치면서 신용등급의 평균회귀 현상을 강화시키는지에 검토한다.<BR>[연구방법] 2000년부터 2019년까지 국내 상장 제조기업을 대상으로 Anderson et al. (2003)의 비대칭적인 원가행태의 틀을 활용하여 실증분석한다.<BR>[연구결과] 매출 감소 시 신용등급을 상회(하회)하는 기업에서 재량적 원가인 판매관리비의 하방경직성이 강화(완화)되는 것으로 나타났다. 차이에 따른 특성이 영향에서 그룹과 그룹에서 상반된 결과가 도출되었다. 즉, 높은(낮은) 그룹에서는 시판매관리비를 완만하게(가파르게) 축소시켜 하락(상승) 가능성을 높이는 나타났다.<BR>[연구의 시사점] 기업을...

10.23839/kabe.2021.36.3.1 article KO Korean Business Education Review 2021-06-30

In facial image synthesis, the style of source is converted using a reference image, or images with different styles are synthesized by each attribute segmentation map. However, previous works cannot deal fine areas because changed mostly in large such as hair, eyes, and mouth. To overcome limitation, we propose novel method synthesizing micro-level elements. A deep learning-based high-resolution synthesis model employed after generating label from face RGB through skin micro-element...

10.1109/fg57933.2023.10042571 article EN 2023-01-05

명시적 비윤리 표현과 달리 암시적 표현은 학습 데이터로 선정하기 어려울 뿐만 아니라 향후 생산 패턴을 예측하기 어렵다. 따라서 표현에 대한 언어 모델의 탐지 능력을 향상시키기 위해 약점을 발견하는 연구가 필수적이다. 본 논문에서는 표현의 표기(야민정음, 외계어)를 변경하고 긍정적 요인(어휘, 이모티콘)을 삽입하여 예측에 변화를 유도하였다. 또한, 야민정음, 외계어, 이모티콘을 활용한 추가 실험을 설계했다. 그 결과, (1) 표현 검출 과정에서 텍스트 자체보다 이모티콘의 영향력이 더 강하고, (2) 모델이 특정 입력 변화에 취약하다는 사실을 발견하였다. 이후 취약성을 보인 변형 형태를 활용하여 파인튜닝 데이터 세트를 구성한 뒤, 파인튜닝을 진행하였고 눈에 띄는 성능 개선을 끌어내었다. 이를 통해 향상하기 위해서는 보다 다양한 유형의 학습하는 것이 필수적이라는 결론을 내렸다. 연구를 계기로 모델을 이용한 탐지에 관한 더욱 활성화되기를 기대한다.

10.46397/jaih.15.3 article KO Journal of AI Humanities 2023-12-31

In this paper, we propose a method to remove the residual speech effects of cepstral mean used in channel normalization. Rather than using roots linear prediction polynomial, pole-filtering that utilizes pre-determined information for implementation Pole-Filtered Cepstral Mean Subtraction (PFCMS), effectively separates from channeled speech. Using 8 simulated telephone channels, compared relative errors estimating cepstrum, speaker identification and computational efficiency CMS, PFCMS...

10.1109/iscas.2001.921083 article EN 2002-11-13

In this paper, we focus on the combined method of SBR and GMM-UBM its capacity for detection robustness speaker recognition. While each has achieved improvements independent other in an orthogonal field, both methods have a similar framework. The proposed Signal Bias Removal based GMM (SBR-GMM) executes minimization environmental variation mismatched condition by removing bias distorted input signal adaptation speaker-dependent characteristics from clean, text background GMM. our...

10.1109/icassp.2002.5745590 article EN IEEE International Conference on Acoustics Speech and Signal Processing 2002-05-01

Many studies have been conducted to replace lead based materials with non-lead in the Plasma Display Panel (PDP) industry, because of environmental problems posed by former. One encountered wet milling is elution alkaline components frits, which are added improve thermal properties PDP. The purpose our study investigate quantitatively improvement frit surface afforded treatment. After making frits an average particle size 2–3 μm through milling, they were heat treated at different...

10.1080/15421400903240845 article EN Molecular Crystals and Liquid Crystals 2009-10-30

This paper examines the strategic conditions that drive entrepreneurial innovators to pursue novel innovation rather than is closer existing technologies. To an increasing extent, startups commercialize in a cooperative setup. Because radical breakthrough more difficult communicate its incremental counterpart, may avoid for which cost of developing credible information exceedingly high. In context Orphan Drug Act (ODA), this study uses difference-in-difference approach measure whether...

10.2139/ssrn.3161869 article EN SSRN Electronic Journal 2018-01-01

날씨 정보에 대한 중요성의 확대로 사물 인터넷 기반의 정보 응용 프로그램이 증가하고 있다. 하지만 기존 프로그램은 방대한 양의 데이터를 효율적으로 저장 및 관리하지 못한다. 또한 데이터가 보유하고 있는 속성 정보를 활용하지 않으므로 내포하는 의미를 활용한 지능적 검색이 어렵다. 본 논문에서는 이러한 문제들을 해결하기 위해 사물인터넷 미들웨어인 MinT를 활용하여 관리 온톨로지 시스템을 구축 한다. 미들웨어에서 온톨로지를 적용하여 센싱 관리하고 공유할 수 추론엔진과 규칙기반 사용함으로써 수집된 데이터에 부여하였다. 구축된 사용하여 사용자의 질의에 검색결과를 UI를 통해 제공하였다. 성능평가를 위하여 성능척도로 검색결과에 유용성을 사용하였다. 실험 결과에서 제안된 시스템은 높은 가진 검색 결과를 제공함을 보였다.

10.5626/jok.2019.46.1.97 article KO Journal of KIISE 2019-01-23

In this paper, we propose SMO (Smart Mobile Objects) based on Internet of Things using a Leader-Follower approach in MinT (Middleware for Cooperative Interaction Things). the proposed system, leader mobile object and follower are implemented to avoid obstacles while real-time tracking specific objects by image processing.

10.1109/icce.2019.8662030 article EN 2023 IEEE International Conference on Consumer Electronics (ICCE) 2019-01-01

시맨틱 검색은 IoT 기술과 결합하여 사용자의 의도를 분석하여 가공된 방대한 데이터를 기반으로 추론을 통해 능동적인 해석을 수행한다. 따라서 사용자에게 만족도 높은 정보를 반환한다. 본 논문에서는 제한적인 사물인터넷 환경에서 검색을 효율적으로 수행하기 위해 미들웨어인 MinT에 온톨로지를 적용한 시스템인 OMT를 제안한다. 온톨로지는 IoT-Lite를 확장하여 구축했으며 날씨 포함하는 클래스간 제약 사항인 Genera Class Axioms와 클래스 간의 관계를 나타내는 SWRL Rules를 정의했다. OMT는 실시간으로 의미 기반의 제공하는 것을 목적으로 한다. OMT 시스템 및 온톨로지의 성능을 평가하기 UI를 반환되는 추론 요소의 개수 결과 반환 시간을 측정했다. 실험 결과, 시간 추론요소 개수의 trade-off를 비교하여 적절한 수의 Axiom 설정이 중요함을 보였다.

10.5626/ktcp.2019.25.9.459 article KO KIISE Transactions on Computing Practices 2019-09-19

Programmed death 1 (PD-1) is a coinhibitory receptor on the T-cell surface and its primary biological function to maintain peripheral tolerance by...

10.34184/kssb.2019.7.4.90 article EN Korean Society for Structural Biology 2019-12-31
Coming Soon ...